UTProt Galaxy: ~ 創薬のためのタンパク質のリガンド結合部位予測ツール生成パイプライン ~

応募者の情報
ご氏名 番野雅城, 込山悠介, 清水謙多郎[学生]
ご所属 東京大学
e-mailアドレス masaki070540 [at] bi.a.u-tokyo.ac.jp
応募するアプリケーションの情報
アプリケーションの名称 UTProt Galaxy: ~ 創薬のためのタンパク質のリガンド結合部位予測ツール生成パイプライン ~
アプリケーションのURL http://utprot.net:8080/
アプリケーションの概略説明 機械学習を用いた、利用者が指定したリガンド(糖、脂質、金属イオンなど)に対し、そのリガンドが結合するタンパク質の部位(リガンド結合部位)を予測するツールの自動生成パイプライン。
アプリケーションの詳細説明 生命システムの解明には、タンパク質のリガンド結合部位の解析が重要であるが、生化学実験や構造決定などの実験的手法は、一般に複雑な手順・高額な装置・研究者の熟練等が必要である。そこで、バイオインフォマティクスの手法を用いたリガンド結合部位予測・解析システムが期待されている。UTProt Galaxy は、統一的なフレームワークで、利用者の目的にあった精度の高いリガンド結合部位予測ツールを、最新のデータを統合することにより、自動的に生成するシステムを構築した。生成される予測ツールは立体構造未知なタンパク質も予測可能で計算コストも小さく、ゲノムワイドな予測が可能である。



UTProt Galaxy は、データセット生成パイプライン、予測ツール生成パイプライン、リガンド結合部位予測パイプラインの3つのパイプラインで構成されている。
データセット生成パイプラインは、タンパク質アミノ酸配列データベース UniProt、タンパク質立体構造データベース Protein Data Bank (PDB)、及び UniProt の間の相互参照情報を記述した EBI-SIFTSと、我々が開発したリガンド結合部位データベースである Protein Ligand Binding Pair Database (PLBSP) を統合検索することで、ユーザーが指定したリガンドと結合するタンパク質のアミノ酸配列およびリガンド結合部位を取得する。
予測ツール生成パイプラインでは、データセット生成パイプラインが取得してきたデータをもとに機械学習の手法を用いて、リガンド結合部位予測ツールを自動的に生成する。
リガンド結合部位予測パイプラインは、予測ツール生成パイプラインで生成した予測ツールに結合部位を予測したいアミノ酸配列を入力し、どのアミノ酸残基が結合部位となり得るか予測する。



UTProt Galaxy は、これまで多くの時間や労力を必要としてきたリガンド結合部位の予測をWebベースで比較的短時間で実行することが可能となり、生命科学の研究効率化・コスト削減につながることが期待される。





【参考】

統合データ解析トライアル http://biosciencedbc.jp/tec-dev-prog/rdprog-over/rdprog-over-trial


中間報告資料(操作チュートリアルを含む)

http://biosciencedbc.jp/gadget/rdprog_over/tt04_banno_m.pdf



UTProt

http://utprot.net/

UTProt タンパク質のリガンド結合部位予測ツール生成パイプライン

http://utprot.net/index.php/analytics-tools/xbind


利用したデータセット PLBSP (http://utprot.net/index.php/semantic_web/plbsp-lod/)
wwPDB/RDF (http://rdf.wwpdb.org/pdb/)
UniProt (http://www.uniprot.org/)
EBI-SIFTS (http://www.ebi.ac.uk/pdbe/docs/sifts/)
アプリケーションの権利指定
表示
原作者のクレジット(氏名、作品タイトルとURL)を表示することを守れば、改変はもちろん、営利目的での二次利用も許可される最も自由度の高いCCライセンス。
関連する作品の情報
関連するアイデア i043
関連するデータセット d064 d065
関連するアプリケーション
関連するビジュアライゼーション作品
関連する基盤技術作品

登録情報の修正について

修正の希望がある場合には実行委員会までご連絡下さい。lod-challenge[at]sfc.keio.ac.jp *メールアドレスの[at]を@としてお送り下さい。