VISTA
2017 年 7 月 26 日 改訂
井上 潤

VISTA は non-coding 領域を含めた長い DNA 配列を,主に脊椎動物・主要系統の種間で比較するソフトウェアです.Non-coding 領域内部において,保存性の高い領域を探すことを主な目的にしているようです.最大の売りは,Exon や Intron などの情報を取り入れてアライメントを検証できる点です.
 
ゲノムが公開されている脊椎動物で,すでに作成されたアライメントを検証することもできる (Precomputed Alignments: VISTA Browser など) 一方,自分で解読した配列をアライメントすること (Submit Your Sequences: mVISTA など) も可能です.

Web 上での操作が主な使い方のようです.Java を用いるので,Java のセキュリティ設定を行ってください.Java が動かないと,Vista を使うことができません.Mac user は下の「Mac: Java セキュリティの設定」を参照してください.


Mac: Java セキュリティの設定

Mac の場合はこちらなどを参考に,セキュリティ設定を変更してください.私が行った設定を以下に示します.「システム環境設定 > Java > セキュリティ > Java コントロール・パネル」で以下を例外サイトリストとして入力してください.

http://pipeline.lbl.gov/




例題: VISTA Browser でヒト vs Chimp ゲノム比較
VISTA Browser は,VISTA プロジェクトであらかじめ作成されていたゲノムアライメントを表示するオプションです.

まずは,こちらのデモを見ると良いです.例題として,ある論文で発見されたヒト vs Chimp の SNP を,既存のゲノムアライメントから見つける作業を行っています.



  • Release によって種数と内容が異なる:Mar 2006 と May 2004 (ナメクジウオが入っている) の二つが充実しています.
  • Release によって最初の画面が異なる:例えば,Feb 2009 を選ぶと Human vs Mouse だけですが,Mar 2006 は ,Human vs 6 種のアライメントが出ます.もちろん後から種を足せば同じようなアライメントを作成することができます.以下を参照してください.



例題: mVISTAで遺伝子前後のアライメントを作成
mVISTA は,配列およびアノテーションデータをインファイルとしてアップロードしてアライメントするオプションです.このため,独自に解読したデータなどもアライメントに加えることができます.Instructions はこちらです.

例題として,Dusp6 遺伝子とその前後 10kbp の配列アライメントを,Human, Mouse, Chicken, Zebra Finch, Zebrafish, Medaka 間で作成します.詳細は Instructions も参照してください.infile と outfile は VISTA_example.tar.gz からダウンロードしてください.

配列とアノテーションファイルのダウンロード

Ensembl から Dusp6 のページを開いて,配列データ (.fa) とアノテーション (.txt) ファイル (以下) をダウンロードします.


例えば Zebrafinch のページはこちらです.

mVISTA を用いたアライメントの作成

mVISTA を選択.
Total number of sequences を 6 に設定して,Submit を押す.

以下の手順でファイルのアップロードを行いデータを Submit すると,結果へのリンクがメールで送られてきます.

結果

結果はメールで送信されてきます.この例だと 5 分ぐらいかかるでしょうか.リンクを開くと以下のように結果のリンクが貼られたページが開きます.
以下の図では Human の VISTA-Point を開いています.PDF ファイルだけ上記のダウンロードファイル (VISTA_example.tar.gz) に入れておきました.





その他:Exon 領域の表示

上記,Ensembl からダウンロードした Vista フォーマットのアノテーション情報を,配列データと照らし合わせるスクリプトを作りました [2016 年 2 月].
annotator.tar.gz

[junINOUEb:annotator]$ perl 010_annotator.pl
[junINOUEb:annotator]$ perl 020_gapping.pl




例題: rVISTAで転写因子結合部位を推定

mVISTA でアライメントのサイトで rVISTA を行います.

転写因子結合部位 (transition factor binding sites) を推定します.配列の長さは 20kbp 以下でないと動きません.


リンク集
VISTA Exercises 2009 年作成?
vista_screen.pdf 使い方のスライドです.