遺伝子機能情報の高度化によって有用遺伝子を探しだす

(1)遺伝子機能関連情報の集積による有用遺伝子の探索
様々な遺伝子機能に関する情報を収集および二次解析を行い集積させることで、現行のデータベース検索では実現できない、有用物質生産や生体内での詳細な機能をもつ重要遺伝子、機能が未知な遺伝子について機能を推定する手法を開発する。これにより、特定の遺伝子や実験で得られた遺伝子、ゲノム解読後に予測された遺伝子について、重要(有用)な機能をもつ遺伝子を予測し、遺伝子配列と生物の特徴(遺伝型と表現型)との関連性を明らかにする。

(2)多型情報に基づく有用遺伝子の探索
同じ種類の生物でも個体や品種間で形質(表現型)の違いが見られ、その原因を調べるために、ゲノム塩基配列の違い(変異・多型)と遺伝子機能との関連性が調べられている。多型には一塩基多型(SNP)や構造多型(SV)、コピー数多型(CNV)など幾つかの種類があり、生物の形質への関連性を調べるため、これらの多型について、遺伝子発現やタンパク質機能にどの様に影響するかが調べられる。 本研究では、多型(SNP)の遺伝子発現制御機構への影響を調べるため、プロモータやエンハンサーを深層学習といった情報解析技術を用いて推測し、遺伝子機能と形質との関連性を調べる。一方、タンパク質におけるSNPの影響を調べるため、深層学習を用いた高精度なタンパク質立体構造予測法であるAlphaFold2を用いて立体構造を予測し、その構造から活性部位を推測することで「機能的SNP」を明らかにする。 これらにより、多様な作物や品種の性質に関わる遺伝子を知ることができ、それらの遺伝子を用いることで、新たな作物や品種を作り出すことができる。

(3)高度化した遺伝子機能情報を用いた知識発見手法による有用遺伝子の探索
様々な分野において、多様なデータが蓄積されており、データ間の繋がりから新たな知識を見出すグラフネットワーク解析や機械学習、そして、現在盛んに行われている深層学習(ディープラーニング)といったAI手法などが開発されている。さらに、蓄積された情報はデータベースから公開されており、各データベースに格納されたデータを二項関係(A→B)で記述することで、データベース間におけるデータの繋がりから知識発見を行なうセマンティックウェブ技術(RDF(Resource Description Framework)など)も盛んに開発されており、生物学分野では、特に欧州バイオインフォマティクス研究所(EBI)や日本のライフサイエンス統合データベースセンター(DBCLS)などが公開しているバイオインフォマティクス関連データベースについてRDF化が進められている。 ここでは、集積された遺伝子機能情報を用いて、グラフネットワークやディープラーニング、セマンティックウェブ技術といった手法を用いて知識発見を行ない、有用な遺伝子を探索する手法を開発する。

転写産物および遺伝子機能の網羅的解析

  ・実用作物についての転写産物の解明に関する研究
医薬品や食品、飲料などで用いられる実用作物について、網羅的な遺伝子発現プロファイルデータについての情報解析を行うことで、代謝産物配列の解読や遺伝子制御機構の解明。機能遺伝子の推定、代謝産物や多型との関連性を明らかにする。 また、様々な薬用植物が漢方薬などに用いられており、それぞれの植物において、薬効成分を作り出す遺伝子を明らかにすることで、薬効成分を大量かつ迅速に産生する品種や作物を作り出すことができる。また得られた遺伝子情報はデータベースから公開するため、製薬会社などに有益な情報となる。

ゲノム配列の解読によるゲノム、遺伝子構造の解明

 様々な生物がもつゲノム配列を解読し、情報学的解析を行うことで、ゲノムの多様性や遺伝子機能を明らかにし、生物がもつ特徴との関連性を解明する。

・ホウレンソウのゲノム構造の解明
多くの植物は、花びらの中に雄蕊と雌蕊がある両性花であり、キュウリやカボチャでは、雄蕊と雌蕊を別々にもつ雄花と雌花をもつ。一方、ホウレンソウは、株によって雄花をもつ雄株と雌花をもつ雌株に分けられる雌雄異株の性質をもつ。イチョウやキウイフルーツ、ホップなども雌雄異株の性質をもつ。ホウレンソウでは、雄株と雌株以外にも、雄雌の両方の機能を有した間性株(雌雄同株)が存在するという多様な性決定機構をもっており、性決定遺伝子はまだ明らかにされていない。 そこで、XX株とYY株のゲノム配列を解読することで、ホウレンソウの育種で重要な形式となる性決定遺伝子の同定を行い、さらに、抽苔性(開花)、カビやウイルスに対する病害抵抗性に関与する遺伝子を明らかにする。これにより、効率が良く、迅速に求める形質をもつ品種を作り出すことができるようになる。