- 包括的で一貫したデータの準備:
- リガンド: 重複を除去して互変異性体とイオン化を処理
- 応答プロパティを準備(スケーリングとビニング)
- 適切な手法でデータをトレーニング・セットとテスト・セットに分割
- 多数の物理化学的、トポロジー的、電子的、幾何学的ディスクリプター、フィンガープリントおよび量子力学ベースのディスクリプターから選択します。
- ベイズ、MLR (重回帰分析)、PLS (部分最小 2 乗法)、GFA (遺伝子機能解析)などの統計モデルを作成
- モデル適用範囲(MAD)、自動テスト・セット検証、交差検証、統計メトリクスを使用してモデルを解析および検証
- Matched Molecular Pairs (MMP)変換を特定してアクティビティ・クリフを調査