ORTHOSCOPEs

2019 年 1 月 10 日 改訂

ORTHOSCOPE は遺伝子系統樹を推定して,オーソログを判定するウェブツールです.以下の解析が可能です:

1. 未知 (あるいは既知) の遺伝子配列の機能を推定する.
2. オーソログの配列を,他の種から得る.
3. オーソログが他の種に存在する確かめる.

解析には,脊椎動物を中心とした左右相称動物 350 種以上のゲノムデータ (アミノ酸配列と DNA 配列) をデータベースとして自由に選べます.


上記リンク (ORTHOSCOPE, https://www.orthoscope.jp) がつながらないことがあります.その場合は,以下のリンクからご利用ください:
http://fish-evol.unit.oist.jp/orthoscope
(2019/1/19).

例題
解析方法

1. 「Example」 から,クエリ配列をダウンロードします.

2. 「ファイルを選択」から,ダウンロードしたファイルをアップロードします.

3. 「Execute」を押して,解析スタートします.


例えばユーザーは,手元にある未知の遺伝子配列をクエリ配列とし解析できます.

「Genome Taxon sampling」から,解析に含めるゲノムデータを選ぶことが可能です.

「Mode: Tree search only」を選べば,遺伝子系統樹の推定のみ行えます.


結果の解釈

ナメクジウオ_未知の遺伝子をクエリ配列として推定された遺伝子系統樹を例とします.

ナメクジウオ_未知の遺伝子は,遺伝子A と同じ機能を持つと推測できます.それは,ナメクジウオ_未知の遺伝子が,ショウジョウバエ_遺伝子Aヒト_遺伝子A と同じクレード (オーソグループ) に含まれるためです.ショウジョウバエ_遺伝子Aヒト_遺伝子A は,basal node で存在した遺伝子に由来します.この祖先遺伝子は遺伝子A と同じ機能を持っていた,と仮定できるのです.

ORTHOSCOPE で予想された結果は,実験的に機能を確かめる際のヒントになります.


オーソグループとは

ORTHOSCOPE の機能推定は,オーソグループ (orthogroup) に基づくものです.

オーソグループとは,共通祖先の一つの遺伝子から派生した遺伝子のセットです (Emms and Kelly 2015).ORTHOSCOPE は,オーソログを集めたい分類群 vs その姉妹群の分岐 (key node),に対応する分岐 (basal node) を,遺伝子系統樹から探します.そして,この basal node を根幹とする単系統群をオーソグループとして判定します.

オーソグループを構成する遺伝子は,比較によっては,パラローガスな (遺伝子重複で別れた) 関係にあります.しかし,姉妹群である種-3 の遺伝子と比較した場合は,分類群 I である種-1-2 の遺伝子は全てオーソロガスな (種分化で別れた) 関係になります.


オーソグループの配列だけを使った系統樹推定

ORTHOSCOPE 解析の結果を元に,オーソグループのメンバーに絞った系統樹を推定する解析パイプラインを作成しました.NCBI から個別にダウンロードした遺伝子配列も解析に加えられます.

スクリプトは Mac 解析用に Python3 で作成しました.Windows ユーザーはスクリプトを若干改訂する必要があるかもしれません.
DeuterostomeBra_2ndAnalysis.zip

必要なファイルのインストール

系統樹を推定するには,いくつかの解析プログラムをインストールして,パスを設定する必要があります.

RAxML:
こちらから利用できます:https://github.com/stamatak/standard-RAxML
最新版をダウンロード & 解凍してください.解凍してできたディレクトリ (例えば,standard-RAxML-8.2.12) にターミナルから入り,PThreads バージョンをコンパイルしてください.作成されたプログラムを,PATH が設定されたディレクトリにコピーしてください.

cd standard-RAxML-8.2.12
make -f Makefile.SSE3.PTHREADS.gcc
cp raxmlHPC-PTHREADS-SSE3 ~/bin

パスにアドレスを追加します.例えば,

export PATH=$PATH:~/bin


Mafft v7.407:
こちらから利用できます:https://mafft.cbrc.jp/alignment/software/
コンパイルしたのち,こちらのサイトに従ってパスを設定してください.


trimAl v1.2 (Official release):
こちらから利用できます:http://trimal.cgenomics.org/downloads
ターミナルから trimAl/source に入り, make とタイプしてください.作成されたプログラムを所定の場所にコピーしてください.

make
cp trimal ~/bin


pal2nal.v14:
こちらから利用できます:http://www.bork.embl.de/pal2nal/#Download
Perl script のパーミッションを変更して,所定の場所にコピーしてください.

chmod 755 pal2nal.pl
cp pal2nal.pl ~/bin


Ape in R:
R (3.5.2) はこちらから利用可能です.
R をインストールすれば,rscript は自動的にインストールされるはずです.
R のパッケージである APE は,R コンソールから以下のようにインストールできます:

install.packages("ape")


系統樹の推定

1. 適切なアウトグループとオーソグループメンバーを 010_candidates_nucl.txt file に保存します.アウトグループとなる配列は,アライメントの一番最初に置いてください.NCBI などから得た配列 (additional sequence) をここで加えることができます.

2. 100_2ndTree.tar.gz ファイルを解凍してください.
3. 解凍してできた 100_2ndTree ディレクトリにターミナルから入ってください.
4. パイプラインを走らせます.

./100_estimate2ndTree.py

5. ML tree は 200_RAxMLtree_Exc3rd.pdf に保存されます.