生命科学と情報科学が融合した学問分野は、生命情報学(バイオインフォマティクス)と呼ばれています。この分野で扱われるデータは、DNAやRNAの塩基配列、タンパク質のアミノ酸配列や立体構造、またそれらの発現量や相互作用情報など多岐にわたっています。近年、実験による分析・解析技術のハイスループット化により、そのような生命科学データがデータベースに大量に蓄積されています。この分野では、そのようなデータを、情報科学における様々な計算手法を用いて解析し、生命機能メカニズムの解明や創薬・医療の発展に貢献する新たな知識発見を目指しています。また、生命科学に関わる研究に貢献する各種データベースやアプリケーション研究開発を行っています。本研究室では、特にタンパク質を中心として、次のような研究に取り組んでいます。
タンパク質の立体構造データからタンパク質とタンパク質あるいは低分子との相互作用データを抽出し、それらの進化的及び物理化学的な特徴を網羅的に解析することにより、分子認識メカニズムの解明、また相互作用面と立体構造や分子機能などとの関係性の解明につなげることができます。また、この解析から得られた知識は、様々な生体分子間の未だ知られていない相互作用やその部位の予測のためのアプリケーション研究開発に役立てられます。
(参考)
・ Murakami, Y et al. (2013), “Exhaustive comparison and classification of ligand-binding surfaces in proteins”, Protein Science, 22(10), pp.1379-1391, doi:10.1002/pro.2329
・ Murakami Y, (2019), “Study of Characterization of Promiscuous Binding Sites in Protein-Small Molecule Complexes”, Proceedings of the 2019 6th International Conference on Bioinformatics Research and Applications, pp.67–72, https://doi.org/10.1145/3383783.3383794
生体分子間相互作用は、生体機能を恒常的に保つことに関わっています。そのため、協調的な相互作用が崩れてしまうことで、様々な機能障害や疾患を引き起こす原因になります。生命機能を維持する上で、とても重要なその相互作用を同定することは、生命機能メカニズムの解明だけでなく、障害や疾患の治療のための薬剤開発にも役立てられます。そこで、1)の解析から得られた知識に基づいて、機械学習法を用いた生体分子間相互作用を予測するための方法及びアプリケーション開発に取り組んでいます。
(参考)
・ 日本生物物理学会 タンパク質間相互作用
実験技術のさらなる進歩により、より高解像度な生命科学データが大量に蓄積されることが予想されます。バイオインフォマティクスは、情報科学的な様々な計算手法による解析によって、それらのデータの解析から得られた考察や判断にロバスト性を与え、また実験の技術的な限界を補完する重要なアプローチになることが期待されています。また、それによって実験による解析の効率化や解析コストの削減も期待されています。そこで、生命科学データからの知識発見に有用な各種データベースやアプリケーション開発に取り組んでいます。
(参考)
・ NLDB (Natural Ligand Database) タンパク質と天然化合物の複合体DB
・ PSOPIA (Prediction Server of Protein-Protein Interactions) タンパク質間相互作用予測サーバ
・ PSIVER (Prediction Server of Protein-Protein Interactions Sites) タンパク質相互作用部位予測サーバ
・ surFit (SurFit Web Server) タンパク質間ドッキングサーバ