他愛もないバリアントアノテーションの話

NHKの番組に影響されて、考えてみたシリーズ(たぶん続かない)。

遺伝子プールっていう集団遺伝学の概念があるんだけど、あ、意味的には「互いに繁殖可能な個体からなる集団(個体群またはメンデル集団)が持つ遺伝子(バリアントの多様性で構成)の総体」で、これをグラフ化したらどうなるのかなってふと思って、他愛もないこと考えてみた。
この場合のグラフって、棒グラフとか円グラフとかそういうのじゃなくて、数学で言うところのグラフ理論のグラフのこと。

遺伝子プールの各要素(バリアントの多様性で構成)に対して、一つのノードとしての個人が持っている遺伝情報を全てエッジで結ぶ。
そうすると遺伝子プールの要素(バリアントの多様性で構成)VS個人のグラフが、とりあえずできる。

そこで遺伝子プールの各要素(バリアントの多様性で構成,
以降略)の中心性を計算したときに、ある特定の閾値で中心性の高い要素の抽出(A)と、そのような要素と結びつきの強い個人のノードの特定(B)ってできるはず。

そこに、個人の疾患歴などの情報(C)を個人ノードに付加したときに、(A)と(B)との特定のパターンの一致がみられるのであれば、グラフ上のエッジの繋がりから(C)→(B)→(A)の流れを逆にたどって、遺伝子プールの複数の要素を同時にアノテーションできるんじゃないのかな。

今は、特定の大企業がそれぞれ独自のバイオインフォマティクスチーム使って、遺伝子のバリアントアノテーションやってるけど、それって、上記の(A)(B)(C)から構成されるグラフの次元を落として更にその一部に注目して扱ってるだけのような気がする。

人類の遺伝子プールの各要素と個人のノードから構成される巨大なグラフの、特定のバブルを一つ一つみてるだけなのじゃないかな、今の大企業が逐一アノテーションして情報の囲い込みをやってるのは。

将来的には、特定の企業が情報の囲い込みをして遺伝情報にアノテーションしているのが、開放されて全てが共有されて、人類の遺伝子プールと個人ノードのグラフ全体像が明らかになる、そんな時代が遠い未来くるような来ないような気がする。

そうなったとき、ほんとうの意味(どういう意味か自分でもよくわからいけどw)で遺伝情報が個人のものとなって、どこかのサーバーだけで管理されないP2Pみたいな遺伝子情報のやり取りが行わるような未来も来たり来なかったりするのかもしれない。

というようなことを、NHKの番組をみてふと考えてみました。まあ、よう知らんけどね(ぇ