本文へジャンプ

日本人健常者集団における初のヒトゲノム多様性データベースを公開

2011年4月6日
国立研究開発法人新エネルギー・産業技術総合開発機構
国立大学法人東京医科歯科大学

 NEDO「染色体解析技術開発」プロジェクトの成果を基に開発された、日本人健常者集団を対象としたヒトゲノム多様性データベース 「MCG CNV Database」が、2011年4月6日よりWEBサイト「CNVデータベース」にて公開されます。
「MCG CNV Database」は、日本人の100家系における父・母・子供のトリオをアレイCGHで解析した結果を収載したデータベースであり、一般健常者集団におけるゲノムコピー数多様性(CNV) の情報を提供します。このデータにより、1世代で新たに出現するCNV (de novo CNV)の頻度やゲノム領域が明らかとなり、ゲノム情報に基づいた医療において、今回のデータベースは種々のゲノム解析結果の評価指標となり、かつバイオリソースの価値を高める重要な基盤情報となることが期待されます。

(注釈) CNVとは、ゲノムコピー数多様性 (copy number variants)の略。 ヒトゲノムには1細胞あたりのコピー数が個人間で異なるゲノム領域が多数存在することが知られており、1,000 塩基対 (1kb)以上のサイズのコピー数変化をCNVと定義する。

1.背景

 近年の急速なゲノム解析技術の発達は、ヒトゲノムの多様性を解き明かしてきました。特にCNVと呼ばれるゲノムコピー数の多様性は、ゲノムの網羅的解析によって、罹患患者だけではなく一般健常者集団にも広く存在することが明らかになりました。蛋白質をコードする遺伝子を含んでいる場合もあり、疾患の原因となるCNVがある一方で、体質や個体差に関与するCNVや、疾患への感受性に関わるCNV、おそらく表現型に影響を及ぼさないCNVまで、様々な遺伝学的な意義を持つCNVが報告されています。
 そのため、アレイCGH法※1などを用いた疾患の原因となるゲノムの異常探索においてCNVが検出された際には、それが臨床症状に関与する’pathogenic CNV’であるのか、一般健常者集団にも観察されて表現型に関与する可能性の低い’benign CNV’であるのかを鑑別する必要があります。また、CNVは民族集団によって出現する領域や頻度が異なっていることも知られています。そのため、ゲノム解析によって日本人に検出されたCNVが病気の原因になるか否かを判断するためには、日本人の一般健常者集団におけるCNVの領域や出現頻度、さらに親から子への伝わり方などに関する情報が必要不可欠となります。その課題を解決するため医療基盤となる重要な本技術情報の解析収集に取り組んできました。

2.今回の成果

 今回公開された「MCG CNV Database」は、NEDOが実施する「染色体解析技術開発」プロジェクト(2006年度~2010年度事業)の支援を受け、東京医科歯科大学難治疾患研究所(稲澤 譲治 研究室)で開発された高密度BACアレイを用いて、日本人一般健常者親子集団におけるゲノム多様性を網羅的に解析し、その結果が収載されています。本データベースは、日本人100家系における父・母・子供のトリオを対象とした、のべ300人の血液中の白血球に由来するDNAを試料として“アレイCGH解析”を行い、得られたゲノムコピー数の多様性 (CNV)を収載して構築されたものです。その解析には、東京医科歯科大学・難治疾患研究所・分子細胞遺伝学教室(稲澤 譲治 研究室)が開発してきたWGA-4500、WGA-15000の2種類のBACアレイを使用しました※2, ※3。本データベースは、以下の特徴を備えています。

(1) 日本人健常者集団におけるBACアレイ検出のCNVの初のデータベースである。

 ブラジル移民の日本人健常者集団を対象に、BACアレイを用いて検出したCNVの頻度・染色体上の位置・サイズ・コピー数などの情報を得られる初のデータベースです。CNVは民族集団によって出現の頻度が異なることが報告されているため、ブラジル移民の日本人の本データベースは、日本人における病気に関わるゲノム異常の判定や診断の指標となる貴重な基盤情報となることが期待されます。

(2) 父・母・子供をトリオで解析したデータを基盤としている。

 親子トリオ解析によって、子供に検出したCNVが両親のいずれに由来するものか、または子どもの世代で初めて出現したde novo CNVであるかの情報を提供しています。すなわちde novo CNVは1世代で新たに生じるCNVであり、日本人におけるその頻度や位置情報を提供するのは本データベースが初の試みとなります。

(3) 既存のデータベースと連携している。

 現在広く用いられているゲノム多型のデータベースであるDatabase of Genomic Variant、遺伝性疾患・遺伝子のデータベースであるOMIM、 ゲノムブラウザであるUCSCにリンクしており、世界のゲノム解析の進捗に合わせた情報検索の利便性を格段に向上させています。

3.今後期待される成果

 本データベースの提供する情報を基盤とすることで、種々のゲノム解析によって得られたCNVが疾患に関連する変化であるかどうかをより早く正確に評価することが期待できます。本NEDO事業において開発され、2009年9月に富士フイルム株式会社より実用化供給が図られ、株式会社ビー・エム・エルで受託検査が開始されている診断型アレイのGenome Disorder Array(通称:GDアレイ)についても、その解析結果の評価をより確実で、より高い精度の診断ツールとして臨床応用が可能となります。
 また、健常者に検出されるCNVは、SNP (1塩基多型)と同じように、疾患の感受性を規定するファクターとなることが知られています。そのため、日本人におけるCNVの頻度は、希少な遺伝疾患だけではなく、生活習慣病やアレルギーなどの一般的な疾患を理解する上でも重要な基盤情報となります。現在、ゲノム情報に基づいた新たな医薬品開発や医療機器開発を促進する「医療イノベーション推進」が構想されており、本データベースはバイオリソースの価値を高める情報資源として、「生体試料」のバイオバンクと「ゲノム情報・臨床情報」のデータベースの統合によって成立する“バイオリソースセンター”の重要な基盤になると考えられます。

 なお、本プロジェクトはその計画が東京医科歯科大学・難治疾患研究所ならびに名古屋大学大学院医学研究科に設置された倫理委員会において審議され承認のうえ実施されたものです。

4.お問い合わせ先

(本プレス発表の内容について)
NEDO バイオテクノロジー・医療技術部  下川 晃彦、林 智佳子、古川 善規  TEL: 044-520-5231
東京医科歯科大学 難治疾患研究所・教授
東京医科歯科大学 硬組織疾患ゲノムセンター・センター長  稲澤 譲治
東京医科歯科大学 硬組織疾患ゲノムセンター・特任講師  林 深  TEL: 03-5803-5820

(NEDO事業についての一般的な問い合わせ先)
NEDO 広報室  田窪、鈴木  TEL: 044-520-5151

【用語解説】

※1 アレイCGH法
Comparative Genomic Hybridization法(比較ゲノムハイブリダイゼーション法)の略。テストDNAとコントロール(対照)DNAをそれぞれ異なる色素でラベルした後に、マイクロアレイ上にスポットされたDNA断片に対してハイブリダイゼーションを行い、蛍光強度を比較することでテストDNAにおけるコピー数の変化を検出する方法として知られる。

※2 WGA-4500とWGA-15000のデザイン
‘MCG Whole Genome Array-4500’ (WGA-4500)は4523種類のBACクローンを搭載し、全ゲノムを約0.7 Mbおきにカバーするゲノムアレイである。また、‘MCG Whole Genome Array-15000’ (WGA-15000)は、15,000種類のBACクローンによって全ゲノムの遺伝子密度の高い領域をほぼ隙間なくカバーする高密度ゲノムアレイである。

※3 BAC
バクテリア人工染色体(Bacterial artificial chromosome)の略。150-200キロ塩基対(15万-20万塩基対)の比較的大きいサイズのDNA断片をベクター内に安定に保持。クローニングが可能である。