2018年12月12日水曜日

冷やせば安全とは限らない

蛋白質の凝集やアミロイド化は、神経変性疾患をはじめとして様々な病気に関連しています。この凝集などの出発点はしばしば、その蛋白質がしっかりと折り畳まれていない、部分的に緩んだような構造(折り畳み中間体)になってしまうことにあります。この折り畳み中間体の構造を原子レベルで検出するのはかなり難しいことです。寿命が長くなく、ほんの一瞬であり「ずっと捉える trap」することが難しいためです。そのため、よくストップトフローなどを使います。そこで長時間その折り畳み中間体を維持するようにアミノ酸変異を加えたり、ちょっとだけ変性剤を加えて故意に不安定にさせたりなどの工夫がなされてきました。もちろん結晶にはほぼなりませんので NMR で観るのが良いのですが、さまざまな構造の間をμs-ms の時間領域で交換し合っていると、NMR 信号が広幅化してしまい、あまりきれいには観測できません。

蛋白質を熱すると変性してしまいます。これは熱によって各原子の動きがより活発になり、折り畳みを維持することができなくなるためです。一方、低温(-20℃ 以下など)にもって行っても蛋白質が変性してしまうことがあります。実際には変性する前に溶液が凍ってしまうため、蛋白質を冷凍庫に入れたからといって必ずしも変性してしまうわけではありません(変性したとすると、液体窒素で瞬間冷凍しなかったためでしょう)。この低温変性という現象は、周りの溶媒である水の疎水性が上がるためと言われています(すると、蛋白質の内部に向いていた疎水性残基が表面に出て来て水と相互作用しようとします)。高温変性は一気に(協同的に)起こるのですが、低温変性はもう少しゆっくりと起こるので、下記の論文のように、変性の途中の構造をトラップして観ることができるかもしれません。

Jaremko M., Jaremko L., Kim H.Y., Cho M.K., Schwieters C.D., Giller K., Becker S., and Zweckstetter M. (2013) Cold denaturation of a protein dimer monitored at atomic resolution. Nat. Chem. Biol. 9(4), 264-270. doi: 10.1038/nchembio.1181.

著者らは(よく存じていますが、彼らは本当にアクティブですねえ)日和見(院内)感染で有名な腸球菌の CylR2 という蛋白質を調べました。これは溶解温度 Tm が 77.5℃ と大変安定な蛋白質です。25 ~ -16℃ までの温度で 1H/15N HSQC を測定した結果、低温になるほどピークがぼやけてきました。蛋白質分子全体の回転が止まってきたことも原因と思いますが、著者らは低温では複数の構造の間で交換が起こっているため(つまり Rex の上昇)と解釈しています。実際、温度変化に対するピークの移動は見た目で直線に乗っていない場合もありました。これは交換している構造が2つ以上ある(つまり、単純な二状態転移ではない)ことを示しています。

次に {1H}-15N 異種核 NOE を測りました。25℃ では平均値 0.81 という頑丈さを示しています。-3℃ まで落とすと、2残基が 0.4 も下がりましたが、まだ全体的には構造が維持されているようです。この2残基は後で分かるのですが、二量体の接触面の残基なのです。しかし、-11℃ になると、全体の平均値が 0.27 となりました。この値はモルテン・グロビュール構造に匹敵するか、それを上回る柔らかさです。低温では観たい分子の回転拡散がゆっくりとなることから、必然的に NMR の感度が悪くなってきます。さらに、著者らは低温では直径 1mm のキャピラリーガラスに試料を入れていることから、試料の絶対量も少なくなって感度を落としています。そのため、低温で(距離情報を示す)NOE ピークが少なくなっているのは、単なる NMR 感度の低下のためではないかとも疑えました。しかし、この {1H}-15N NOE の結果は、上記の μs-ms 程度の運動だけでなく ps-ns 程度の速い運動も低温で活発になっていることを示しており、やはり複数の柔らかい構造の間で交換が起こっているようです。

拡散係数を測ることにより、流体力学半径も見積もりました。ちなみにこの蛋白質はホモ二量体です。それによると、-3℃ では二量体が 93% ぐらいあるのに対して、温度が下がるにつれてどんどん二量体が解離し、-11℃ では 1% ぐらいになってしまいました。この実験のすごい所は、25℃ 以外に 0℃ 以下の5つの温度において立体構造を NOE で決めていることです。低温になるにつれ、やはりサブユニット間 NOE が消え始め、二量体が単量体に解離したことを示していました。さらに、低温ではサブユニット内 NOE ピークそのものも少なくなってきますので、単量体構造自身もちょっとフラフラしているようです。

-7℃ では二量体と単量体が半々ぐらい存在します。しかし、ピークが2つに分かれていないことから、両者が速く交換していることが分かります(fast-exchange)。サブユニット間の NOE を解析すると、-7℃ では2つのサブユニットがちょっと離れかけており、25℃ におけるきっちりとくっ付いた二量体とは異なることが分かります。各サブユニットの構造は単量体での構造と似ていることから、今まさに離れんとしている瞬間なのでしょう(よって二量体と単量体が速く交換する)。

-11℃ ではほとんど単量体となりますが、この構造は 25℃ におけるサブユニット単位だけを見た時の構造と似ています。このことから(いくつか水素結合は無くなりますが)サブユニットとしての構造はそれほど変わらずに、しかし、ふわっと緩んだダイナミックな状態(フォールド中間体)で、さらにサブユニット間の相互作用が低温では弱くなっていくようです(-11℃ ではサブユニットはほぼ完全に離れてしまう)。スピンラベルを付けて常磁性緩和を見た実験でも、このフォールド中間体の方がブロードになった範囲が広かったそうで、これは構造がダイナミックに揺らいだために、蛋白質のより広い範囲がスピンラベルに晒されたことを意味しています。

-11℃ における単量体は、全体構造としては 25℃ でのサブユニット構造と似てはいます。しかし、部分的に動きが逆に固くなった箇所があります。それは二量体でサブユニット間の相互作用に寄与していた疎水性残基の側鎖が、単量体では内側に向かったためだそうです。むしろ、この残基が隣のサブユニットとの協力関係を打ち切って、同じ内輪の方に寝返ってしまったために、二量体が解離してしまったのでしょう。この残基が関与する相互作用は、25℃ の native 構造では見られなかったもので、フォールド中間体で初めて生じた相互作用です。代わりに溶媒の方に向いた側鎖もあるようで、主鎖の全体構造に目立った変化はないものの、やはり二量体から単量体に激変したとなると、側鎖の向きに再調整が起こるようです。どんどん低温にもって行った時に最後に残るのは疎水性コアの部分で、この部分とすぐ隣にある(ヘリックス・ターン・ヘリックス)部分との間の中長距離 NOE は低温になるほど観えなくなると書かれています。この疎水性コアを維持しているメチル・メチル相互作用がかなり強いので、その周りの領域がちょっとぐらいフラフラしても、このフォールド中間体は何とか全体構造を保っているのでしょう。

面白いことに相互作用相手である DNA と複合体を作らせると、低温でも構造が崩れなかった、つまり二量体のままであったとのことです(ちなみに、この蛋白質はリプレッサです。IPTG と作用する Lac リプレッサもそうですが、DNA に付く蛋白質は二量体で機能することが多いです)。安定性が増して、低温変性が始まる温度が下がったのでしょう。

この論文の蛋白質では、二量体が単量体に分かれ、その二量体のインターフェースに関与していた疎水性の側鎖が単量体では内側に向いて疎水性コアを形成しました。結果として、その単量体のフォールド中間体は幾分安定化しました。しかし、ホモ多量体蛋白質の中には、サブユニットどうしが解離し、それが引き金となって疎水性の側鎖が余計に露出してしまい、さらに単量体の構造が全体的に不安定になる場合が多いです。そのような単量体はアミロイド形成に走る場合も多いでしょう。この論文では、低温変性の性質を利用して蛋白質を人工的に不安定にしました。「こんな低温に腸球菌が晒されることはないから、このような人工的、非自然的な条件にするのは生物学的意義がない」などとは言わないでください。低温にするという操作以外でも、酸化 oxidation、修飾 modification、変異 mutation、他蛋白質との非特異的相互作用 non-specific interaction、高圧 high-pressure、外力 rheo などによって、蛋白質は容易に不安定な状況に置かれます。不安定にする手段はいろいろ異なっていても、見られる現象は同じである可能性が高いです。特にこの論文の実験においては、室温に戻すと元の二量体に戻ることから可逆的です。すると「フォールド中間体は実際に自然の中でも起こっているが、そのモル比があまりに少な過ぎて観測できない、しかし、低温に晒すことによって、その割合を増やして観測できるようにしている」とも解釈できます。

Marginal-stability と呼ばれるように、生体内の蛋白質はかろうじて安定性を保っており、上記のようなちょっとした環境の変化により不安定化し、病気の原因となるアミロイドに急速に変貌することがあります(最近は逆に、あえてアミロイドという固体にすることにより、病原性を封じ込めているという説が有力ですが)。ちょうどシーソーのバランスが崩れて雪崩が起きるようなものです。物理的には過冷却の現象にそっくりです。

2018年12月3日月曜日

酸欠になった時

癌細胞は非常に活発に細胞分裂しているため、しばしば酸素が足りていない状態になります。すると、それに対応しようとして血管を新たにどんどん作ろうとします。癌細胞に限らず、新たに作られようとしている組織では酸素が不足してくるので、早く血管を作りより多くの酸素を組織に送り込む必要があります。このように酸素が不足した時には、転写因子である HIF-1 (hypoxia-inducible factor 1, 低酸素誘導因子‐1) の細胞内濃度が高まり、例えば血管の伸長を促すのに関与する蛋白質などの転写活性を高めます。この HIF-1α は、CBP/p300 と相互作用することが知られています。

CREB-binding protein (CBP) は転写コアクチベータ(活性化補助因子)であり、そのパラログ(同じ種内のホモログ)として p300 が知られています。この CBP/p300 はちゃんと fold したドメインを7個含んでいますが、それ以外の繋ぎのリンカー領域は天然変性領域(IDP)です。IDP の領域の合計は 1,400 アミノ酸にものぼり全体の 60% を占めます。そして、CBP/p300 は 400 個以上の転写調節因子と相互作用し、16,000 個ものヒト遺伝子のプロモータ領域に見つかるそうです。この CBP/p300 の N-末端に近い領域に TAZ1 (transcriptional adapter zinc binding motifs) があり、それは4本の α ヘリックスと3つの亜鉛イオンから成り、きっちりとした構造をとっています。この TAZ1 ドメインが HIF-1αと相互作用します。

Berlow, R.B., Dyson, H.J., and Wright, P.E. (2017) Hypersensitive termination of the hypoxic response by a disordered protein switch. Nature 543 (7645), 447-451. doi: 10.1038/nature21705. 

酸素が足りない時、HIF-1α(HIF-1 のトランス活性化領域)は TAZ1 と安定に相互作用し、酸欠に適応するための遺伝子(血管伸長など)の転写を一気に活性化させます。一方、酸素がたくさんある時には、HIF-1α は不要ですので、ヒドロキシル化され(プロリンに -OH 基が付加される)、それが目印となってプロテアソームにより分解されます。

しかし、いくら酸欠状態であっても HIF-1α が元気過ぎると、それはそれでまた問題です。そこで、非常に巧みな仕組みが備わっています。HIF-1α が転写活性を上げると、それにより CITED2 と呼ばれる蛋白質も発現してきます。これのトランス活性化領域が HIF-1α と TAZ1 との相互作用を邪魔します。これにより HIF-1α の転写因子としての活性が抑えられます。上流が下流を促進させると、その下流が上流を抑制するので、これを負のフィードバック調節と呼びます。

面白いことに、TAZ1 と相互作用する相手には幾つかの蛋白質が知られていますが、いずれも天然変性です。そしてこれら天然変性の間にアミノ酸配列の相同性はあまり見られず、また TAZ1 と複合体を形成すると、一部でヘリックスのような構造をとるものの、そのヘリカル構造に共通性はあまり見られません。逆向きに付く蛋白質もあるぐらいです。そのように単量体では決まった構造を取らない HIF-1α と CITED2 がどのようにして同じ椅子を取り合うのか(競合し合うのか)?詳細はよく分かっていませんでした。

結論から先に書きますと、TAZ1, HIF-1α, CITED2 は一瞬ですが3者複合体を作ります。HIF-1α と CITED2 には LPE(Q)L モチーフと呼ばれる似た配列があるのですが、CITED2 の LPEL モチーフが最初に乗っ取りをしかけます。そして、TAZ1 の構造を変え、それにより HIF-1α の LPQL モチーフを引き剥がします。まるで崖(TAZ1)にしがみついている人(HIF-1α)の手(LPQL)を、後から登ってきた人(CITED2)の手(LPEL)が引き剥がして、前の人(HIF-1α)を奈落の底へ突き落としているかのようです(もっと良い例えを思いつけないのか?)。

HIF-1α と CITED2 がそれぞれ TAZ1 と相互作用する時の親和性を比べた時、CITED2 の方が極端に親和性が高ければ、乗っ取りが成功することは容易に想像できます。しかし、両者の解離定数はほぼ同じ値の 10 nM なのです。それでも、[15N]-TAZ1, HIF-1α, CITED2 を 1:1:1 で混ぜると、[15N]-TAZ1/CITED2 複合体のピークのみが観測されます。これは、非常に効率よく HIF-1α が [15N]-TAZ1 から引き剥がされることを示しています。さらに蛍光異方性を使った相互作用解析においても、TAZ1 と HIF-1α の複合体に CITED2 を追加滴定していった際に見られた解離定数(つまり、HIF-1α 存在下における CITED2 と TAZ1 の間の見かけの Kd)は 50 倍の 0.2 nM に匹敵するとのことです(TAZ1 と CITED2 の2者だけの状態ならば、もちろん 10 nM)。また、ストップトフローでは CITED2 の濃度が高いほど乗っ取りが速く進むのに対して、HIF-1α にはそのような濃度依存性がないという結果が出ています。もし、結合した HIF-1α が偶然にも TAZ1 から離れたすきを狙って CITED2 が結合するのであれば、速度定数の濃度依存性は両者で同じになるはずでしょう。

ここで HIF-1α と CITED2 の複合体におけるダイナミクスが重要になってきます。それぞれには LPQL と LPEL という似たモチーフがあります。しかし、TAZ1 との複合体において、HIF-1α の LPQL モチーフはちょっと動いているのに対して、CITED2 の LPEL モチーフはかなり固定しています。先ほどの崖で例えると、前の人(HIF-1α)は手(LPQL)の力が弱く、あちこちの岩を掴んだり離したりして迷っているのに対して、後から来た人(CITED2)は腕力(LPEL)が強く、崖(TAZ1)のとある岩をしっかりと捉えて離しません。これでは前の人(HIF-1α)が自らすぐに落ちていきそうにも見えますが、この人は脚力(C-末端側の二つのヘリックス)がひ弱な手を補っていて、手足を総合的にみると後の人(CITED2)と同じ程度の力量は持ってはいるのです。しかし、まあ後の人(CITED2)が攻撃を仕掛けてくるこの状況では、いくら足に自信があっても手を離した方(HIF-1α)が負けでしょう。バランスを崩して落ちていきます。このダイナミクスの詳細は {1H}-15N 異種核 NOE という NMR 測定により非常に簡単に観ることができます。

著者らは、N-末端だけの CITED2 を作りました。これは LPEL モチーフを持っていません。これをすでに出来ている複合体 TAZ1/HIF-1α に加えても、HIF-1α は退きませんでした。豪腕(LPEL)という武器がないと HIF-1α には勝てないのです。では逆に LPQL モチーフを除いた HIF-1α を TAZ1/CITED2 に立ち向かわせるとどうなったかです。この結果はわざわざ書くまでもありません。チワワが土佐犬に立ち向かうようなものです。このような競合の詳細は結晶構造解析ではなかなか分からないものですが、NMR ですと何割の分子においてどの原子とどの原子が近くにあるかまで分かってしまいます。今回の試料は分子量が小さいですので、NMR の感度については全く問題がありません。

以上のような仕組みが無かったとしたら。。。HIF-1α を退かすためにはもっと多量の CITED2 が必要になるでしょう。その大量の CITED2 が出てくる間に酸欠対策が行き過ぎ、血管ができ過ぎてしまうかもしれません。しかし、CITED2 はほどほどの濃度で HIF-1α をうまく追い遣る方法を進化の上で獲得しました。転写のスィッチは、必要な時にすぐに ON にならないといけませんが、ON のままでは駄目で不要になった時にはすぐに OFF にしないといけません。生物はこの急速 ON/OFF をいろいろな仕組みで達成しています(アロステリック効果、フィードバック制御、協同性など)。うまい点は、土台となる TAZ1 が CITED2 を気にいって迎えるようにもっていく、つまり、CITED2 が自分自身が入りやすいように TAZ1 の形を変えている点です。このように、まず3者がくっつく → HIF-1α の手を払い除けて CITED2 が手を置く → TAZ1の構造を CITED2 向きに変える、という連続した流れが見られます。この流れはこれまでの硬い鍵と鍵穴だけのストーリーとはかなり違っています。鍵と鍵穴の仕組みであれば、HIF-1α と CITED2 は同じ鍵の形をしていて、同じ様式で鍵穴である TAZ1 に入り込むことでしょう。しかし、実際の HIF-1α と CITED2 は(手の部分を除いて)違う形で TAZ1 と相互作用しています。この乗っ取りは、フラフラとして一見すると鍵になり得ないような HIF-1α と CITED2 だからこそ出来るダイナミクスです。

このようなアロステリック効果が生物のありとあらゆる所で生命機能の調整に関わっているとすると、役者となる蛋白質とそれらが相互作用する時の解離定数を単にたくさん集めただけのデータベースでは、実際の生命現象をうまくシミュレートできないかもしれません。上記の例でいうと、TAZ1 が形を変えていくことも含めた「見かけの(全体としての)解離定数」が必要になってきます。

ここで個人的な疑問です。単に CITED2 の TAZ1 への親和性を高くするだけでは駄目なのでしょうか?もし、そうだとすると、CBP/p300 から CITED2 を外すのが大変になるでしょう。一旦 CITED2 が付いてしまった CBP/p300 は使いものにならず、次に酸素が減ってきた時にその生物は死んでしまうでしょう。もしかすると CITED2 をまた上手く外す仕組みがあるのかもしれません。そのためには、TAZ1 と CITED2 の間の親和性が高過ぎてもいけないのではないかと思います。

2018年11月16日金曜日

魚の腐った匂い

ながらく倉庫に眠っていた Mono-Q カラム。「これまだ使えるかな?」と思って HPLC に繋いで水を流した途端、何気なく「鰹節」の匂いがしました。「はて?」と思いつつ鼻をカラムの出口に近づけたのが最悪で、もうかれこれ数時間が経ちますが、まだ頭痛が続いています。

そういえば、誰かが先月「同じ箱にある古いカラムを流路に繋げたらアンモニアの匂いでまいっちゃった」などと言って騒いでいましたが、あまり取り合いませんでした。しかし、今この部屋中に充満した匂いは凄まじく、部屋のドアを開けたら開けたで今度は廊下を歩いている人から「何事か?」と覗かれる始末です。そこで、ちょっとググってみました。

「anion-exchange chromatography bad smell」

一杯出てきました。どうも陰イオン交換 Q 樹脂が分解されて「トリメチルアミン」という物質が出来てしまったようです。それがちょうど、よりによって腐った魚の匂いだそうで、ものすごく少量(5 ppb ぐらい)でも悪臭になるのだとか。確かに服や手にまで染み付いてしまったようで、今晩はどうやって電車で帰ろうかと悩んでいるところです。手を何度も洗ったのですが、まだ腐った魚の匂いがします。

確かに Q レジンの先には (N+)(CH3)3 がありました。負に帯電した蛋白質などが、このレジンの正電荷と静電的相互作用でくっ付くのです。これが外れるとトリメチルアミンそのものです。「Hofmann 脱離」と引くと、その脱離反応の詳細が出てきました。が、それよりも今は頭痛のため、読んで理解するどころではありません。

そういえば 20 年以上前、誰かが SDS-PAGE 用の TEMED(テトラメチルエチレンジアミン)を冷凍庫から出した時に手を滑らせ落として割ってしまった時のことを思い出しました。建物中の人が集まる程の魚の腐敗臭が翌日も続きました。

さて、どうやって帰ろうか。1時間歩いて帰るしかなさそうです。

2018年9月30日日曜日

コアセルベート化による過飽和

タウ蛋白質は微小管に結合してその安定性を調節している蛋白質ですが、同時に神経変性疾患であるアルツハイマー病の原因とも考えられています。悪さをするタウは重合してアミロイドを形成しています。そのようなタウは、微小管に結合して本来の機能を発揮することはもはやありません。今回の論文はどのようにしてアミロイドにまで育っていくのかの分子機構を NMR 解析も含めて調べたという内容です。

Ambadipudi, S., Biernat, J., Riedel, D., Mandelkow, E., & Zweckstetter, M. (2017) Liquid-liquid phase separation of the microtubule-binding repeats of the Alzheimer-related protein Tau. Nat Commun. 8 (1), 275. doi: 10.1038/s41467-017-00480-0.

ヒトの神経系では選択的スプライシングにより6つのタウのアイソフォームができます。ここで鍵となるのは、微小管に結合する部位でもある繰り返し配列の箇所です。この繰り返し配列だけになるように分解されると、これは全長のタウ(441 a.a.)よりもはるかにアミロイド化し易いのです。繰り返し配列のそれぞれは 31~32 アミノ酸から成りますが、これが3つの場合(3R-Tau)と4つの場合(4R-Tau)が知られています。ちなみに二番目の R が欠けた 3R-Tau は 4R-Tau よりも液滴を作る傾向が低いようです。

もともとタウはよく水に溶け、必ずしも凝集や沈殿を起こし易いというわけではないようです。ただし、ちゃんとした特定の立体構造はとっておらず、いわゆる天然変性蛋白質(IDP)です。これがどのようなきっかけで、そしてどのようにしてアミロイドにまで変化していくのでしょうか?その経路に液-液相分離があると、この論文は唱えています。FUS 蛋白質でも同じように、液-液相分離を経由して不溶性の凝集体になるのではと言われています。また、タウでもそうですが、負電荷をたくさん持った分子(例えば RNA など)と接触すると、このコアセルベーションが促進されて液滴になるようです。

この問題となる繰り返し配列は、疎水性残基をほとんど含んでおらず、とにかく Lys+ がたくさん含まれています。各リピート(31~32 a.a.)のうち Lys は5個ぐらいでしょうか?まず著者らはこの 4R-Tau がどれだけ液-液相分離を起こし易いかを 350 nm の濁度で3日後に調べました。なお、内部の Cys が酸化しないように常に還元剤を入れています。細胞内の環境が還元的であるためですが、もし何かの拍子で分子間ジスルフィド結合が起こると、さらに凝集が進むのかもしれません。まず、pH が等電点である 9.8 に近づくほど液-液相分離しやすいようです。濁度が本当に液-液相分離を反映しているのかを確かめるため、微分干渉顕微鏡で 15 μm ほどの液滴ができることも観ています。また、細胞内の crowd 効果に似せて PEG を加えると液-液相分離が促進されました。なお、アミロイドの特徴であるクロス β 構造ができているかどうかは、しばしばチオフラビン T の蛍光で調べられますが、この蛍光はありませんでした。よって、まだアミロイドは出来ていない段階だということになります。また、このタウ蛋白質は5℃といった低温では液-液相分離を見せず、42℃で液-液相分離を最も起こし易くなるようです。一方 65℃という高温では液-液相分離はできないことから、必ずしも温度による運動性の変化が液-液相分離のできやすさと関係しているとは言い切れません。FUS の場合はある温度(<~20℃)以下にすると液相分離を見せますが、これは FUS には Arg+ が多いのに対して、タウでは Lys+ が多かったり、リピートの N-末端側に P-Xn-G モチーフなどがあるためか?と書かれています。

やっと NMR の登場です。5℃での 2D 1H-15N HSQC スペクトルは典型的な単分散分子の IDP を示しています。ハムの壁(8.6 ppm)がきっちりと見えます。また、37℃ で液滴になってもスペクトルはそれほど変化していません。ここの解釈はかなり難しいところです。実は、CD の変化も観測されており、それによると温度を上げた時に「少しだけ」 β 構造が増えました。しかし、NMR スペクトルからは、新たに β-ストランド構造が増えたようにはとても見えません。もしかすると、液滴の中ではアミロイド構造への変化に向けて β-ストランドのような構造を一瞬はとるが、すぐに崩壊したり他の分子と不安定な超弱い水素結合を組み直したりの構造交換をフレキシブルに続けているような感じに見えます。著者らはさらに MTSL ラジカルをタウの Cys に付けています。まず5℃の単分散状態では、MTSL の周りだけが常磁性緩和しました。これは相互作用が分子内に留まっていることを示しています。一方、37℃ではほとんどのピークが広幅化しました。これは相互作用が分子間にも及んでいるためです。ただし、まだこの時点ではアミロイド化していませんので、相互作用は弱く遷移的で、動的に入れ替わっているでしょう。その様子が β 構造がわずかに増えたという CD の結果に反映されているのでしょう(あるいは、単分散でも液滴でもない、オリゴマーが生じているのかもしれません)。化学シフトが大きく違わないという点から、おそらくは液滴の内外で分子が交換し合っているという描像が当てはまるような気もします。この辺りの描像は次に書く予定の Ddx4 などと似ています(単分散と液滴の間を行き来する分子交換の現象が CPMG 実験で調べられています)。

他の例でもよく知られるように、タウ蛋白質もポリアニオン(多価の陰イオン)物質を加えると、アミロイド化に進みます。代表的なポリアニオン物質は RNA やグリコサミノグリカンであるヘパリンなどです。タウの液滴はポリアニオンが無いとそのままなのですが、これにヘパリンを 1/4 モル等量ほど加えると、もう5分後には重合を始め、2日後にはアミロイド線維になることが観察されています。ここで興味深いことは、液滴ができないような低温や高温では、たとえヘパリンを加えてもアミロイド線維にならなかったことです。しかし、必ずしも5℃でタウとヘパリンが相互作用しなくなるというわけではありません。NMR スペクトルによると、5℃でもちゃんと相互作用しているようです。ヘパリンによるタウの電荷の相殺は、ちょうど pH が pI に近づくのと似ています。この時に疎水性効果が浮き出て来るのでしょうか?しかし、塩濃度を上げると(静電的相互作用が弱まり、疎水性が強調されるはずですが)逆に液滴ができにくくなることから、やはり液-液相分離に至る物理的なメカニズムは複雑そうです。液-液相分離によってまずはタウ蛋白質が集まり、さらに電荷の相殺により、その局所濃度がさらに上がってアミロイド化するといったシナリオが考えられるでしょうか?予想通り 200mM の NaCl 存在下では液滴はできませんが、もちろんヘパリンを加えてもアミロイドはできませんでした。

MARK kinase はタウ蛋白質の Ser をリン酸化します。著者らは実際に 4R-Tau をリン酸化させました。すると、2 μM という低濃度であるにもかかわらず液滴を作りました。この濃度は実際に神経細胞の中のタウの濃度に匹敵します。さらに、この液滴はリン酸化されていないタウをも巻き込んでいくようです。

液滴内部の分子とその外側の単分散状態の分子との間の交換についてですが、この論文では NMR 信号の様子から速い交換と推測しています。この時の速い遅いは化学シフトの時間スケールに対してです。つまり、化学シフトが平均化してしまうほどに速いということで、だいたいマイクロ秒よりも速い場合を指します。一方、オリゴマーと単分散との間の交換もきっと起こっており、これは信号がかなり広幅化することから中間的な速さ(μs ~ ms)と思われます。オリゴマーでは分子間の相互作用がもう少し強いのかもしれません。

一般的に蛋白質の濃度をどんどん上げて行くと過飽和状態になります。ちょうど氷点下以下に冷やした水が何かの振動で急に氷に変わるように、過飽和状態の蛋白質も何か(別分子との接触など)により急に凝集を始めます。蛋白質の結晶ができる時もそうですが、アミロイドが出来ていく時もそうでしょう。タウ蛋白質が単分散している時には濃度は 2 μM 程度ですので、とても過飽和とは言えません。しかし、液滴の中では局所的に過飽和状態になっています。何も刺激がなければこれはこれで準安定状態ですが、ここに何かの刺激(温度変化、pH 変化、塩濃度の変化、ポリアニオンとの接触、リン酸化など)が入ると、急にアミロイドに変わるのかもしれません。

2018年9月25日火曜日

NOE と exchange を分ける in CEST

化学交換を NMR で検出する方法の一つとして relaxation disperson(緩和分散)法が有名ですが、最近は CEST 法(chemical exchange saturation transfer)もどんどん使われるようになってきました。緩和分散法は CPMG パルス系列を使うことからも分かるように、横磁化を対象とします。一方 CEST 法は縦磁化を扱いますので、Tex を 500ms など長い時間に設定することができ、緩和分散法よりも遅い交換(2〜20 ms のτex)を扱うことができます。また、緩和分散法では励起状態の化学シフト値を直接的には求めることができません。化学シフト値は、その励起状態での構造を推測するのに使えますので大変重要です。フィッティングで |Δω| を出した後、その符号を調べるための実験がまた別途必要です。一方 CEST では励起状態の化学シフト値が目に見えるような形で得ることができます。さらに CEST は 13C 均一標識の蛋白質でも可能なようです。緩和分散法では 1J(CC)-coupling は大きな問題ですので、芳香環の 13C の CPMG 実験では 12C-13C-12C のような標識法(alternate labelling)が必要になってきます。

最近は 15N, 13C だけでなく 1H の CEST も出てきました。ここで問題となってくるのは、プロファイルに現れた dip(オフセットを横軸にピーク強度を縦軸にとったプロファイルで、ピーク強度が落ちている箇所)が、果たして本当の構造交換によるものなのか?それとも NOE によるものなのかの区別です。これは高分子の NOESY における NOE 交差ピークが、交換によるピークと区別がつかないことと似ています。しかし、これには良い対策がすでに出ています。一つの 1H 核スピンを2つに分けて区別するのです。つまり、1H-15Nαと 1H-15Nβです。15N 核スピンの T1 が長く、Tex の間は α状態とβ状態が維持されるのであれば、この方法が使えます。構造交換では、1H-15Nαどうしで交換します。同じように1H-15Nβどうしでも交換します。まさか、基底状態の時は 15Nαであったのに、励起状態に移った時には 15Nβになってしまうということはないでしょう(15N T1 が十分に長ければ)。そこで基底状態の 1H/15N を 15N のそれぞれのスピン状態 α or βに応じて別々に測定します(spin-state selectively)。1H/15Nα の CEST における dip と1H/15Nβ の CEST における dip は別々のところ(ちょうど 1J だけ離れた位置)に現れるはずです。それに対して NOE の方は、近くの 1H が saturate されれば、双極子間相互作用を通して対象となる1H に NOE が移ります。その際、donor と acceptor の 1H に付いている 15N が α 状態であろうとβ状態であろうと全く関係ありません。よって、1H-15Nαも 1H-15Nβも同じ dip を持っているはずです。以上より、15N 核スピン状態に選択的に測定して得た CEST プロフィールをお互いに引き算すると、NOE からの寄与はキャンセルされ、本当に構造交換によって生じた dip のみが残ることになります。

Yuwen, T., and Kay, L.E. (2018) A new class of CEST experiment based on selecting different magnetization components at the start and end of the CEST relaxation element: an application to 1H CEST. J. Biomol. NMR. 70(2), 93-102. doi: 10.1007/s10858-017-0161-2.

この論文は更にそれを発展させたものです。15N スピン状態選択的に測定するのは面倒であるので、いっそのこと 2IzSz を測定してしまうという方法です。確かに、HzNa - HzNb = 2HzNz となります。それに伴うアーティファクトについて詳しく書かれています。一つは TROSY 効果により二つのダブレット HzNa, HzNb に強度差が起きることです。その強度差は新旧どちらの方法でも起こるのですが、上記のスピン状態選択法の場合、HzNa, HzNb それぞれで reference(saturation 無し)を測り、引き算をする前にこの reference により規格化してしまいます。そのため、TROSY 効果による強度差がキャンセルされます。それに対して新しい方法では、引き算を自動的にしてしまってから(つまり、2HzNz を検出してから)reference で規格化します。そのため、引き算による完全なキャンセルが出来なくなるのです。しかし、論文によると、それは大したアーティファクトにはならないとのことです。むしろ、two-spin order ではなく in-phase である 15Nz が検出に入ってくることの方が大きいそうです。一応、それを防ぐために 15N に 180 度パルスを偶数発打つ方法も紹介されています。これにより TROSY 効果(1H CSA/1H-15N DD)もキャンセルされ、15N in-phase もかなりキャンセルされます。ただし、Tex の実質的効果は半分になってしまいます。おそらくそこまでしなくても問題はないでしょう。

新旧の方法を比べると、特に 1H/13C HMQC-TROSY の場合は新しい two-spin order を検出する方が感度が高くなります。

2018年8月28日火曜日

大腸菌培養の最少培地 M9 その4

そろそろ終盤に差し掛かってきました。

(3) 安定同位体 (フィルターにて滅菌処理)

15NH4Cl(1.0 g/L と書かれている場合も多いのですが、価格もそれほど高くはありませんので、2.0 g/L 入れるのをお勧めします。)

[13C]-葡萄糖 2.0-4.0 g/L(15N のみ単一標識する場合は、普通の葡萄糖を 4.0 g/L 入れます。良かろうと思ってあまり多量に入れ過ぎると、異化代謝産物抑制(catabolite repression)という現象により発現がストップしてしまうことがあります。Glucose が多過ぎると cyclic-AMP が減ります。すると、cAMP が CAP 蛋白質から外れます。その結果、CAP が promotor から外れて RNA-polymerase をリクルートしなくなります。特にアラビノースオペロンを使っている時にはこれが顕著に起こります。

[2H, 13C]-葡萄糖 2.0 g/L(2H, 13Cでも標識する場合、もちろんこれも 3.0 g/L 入れた方がよいのは確かです。しかし、高くつきます。)

上記を混ぜ合わせて 0.22-0.45 μm フィルターを通して滅菌します。オートクレーブは厳禁です。なお、pre-culture 100 mL と main-culture 900 mL に分けて培養する場合、main-culture に 13C, 15N 安定同位体をすぐに入れてはいけません。pre-culture の育ち具合をみて、もし何かおかしいという場合にはここで実験をストップします。高価な安定同位体を1割しか無駄にせずに済みます。

培地に何かを入れ忘れている場合も多く、その場合 pre-culture と同じように main-culture でも「やっぱり」大腸菌が育たない場合が多いです。このような場合、main-culture をどうすればよいか迷うところですが、1つは、念の為ビタミンと金属類をもう一度いれてあげて、そこから 100 mL を抜き取って培養するのがよいでしょう。ビタミンや金属類は2倍量はいっていても問題ありません。それでも育たない場合は、塩溶液とビタミン核酸溶液を熱いうちに混ぜてしまったのかもしれません。

(4) 50mM CaCl2 2.0 mL

(5) グリセロール 1.0 g (15N のみで標識する場合)

(6) アンピシリン 50-100 ug/mL

(7) 微量金属(Trace-metal)

ZnCl2 20 μM (zinc-finger 蛋白質の場合)
   2 μM (zinc-finger 蛋白質でない場合)
CoCl2 0.4 μM
CuCl2 0.4 μM
NiCl2 0.4 μM
Na2MoO4 0.4 μM
Na2SeO3 0.4 μM
H3BO3 0.4 μM
EDTA 25 μM

論文によっては、これの 10 倍ほど濃い仕様も書かれているのですが、上記でおよそ足ります。金属蛋白質の場合は、その配位するはずの金属をもう少し加えてやらないといけないかもしれません。あまり多量に入れ過ぎるとかえって毒になってしまいます。また Se はちょっと手に入らないかもしれません。

少し探してみると、1000X ストック溶液が販売されているようでした(Sigma 92949)。これを重水に溶かした製品があればよいのですが(凍結乾燥するには面倒です)。

問題は重水培養する時です。その時のために、このストックは重水に溶かしておくとよいでしょう。

また、これら trace-metal の代わりに FeCl3 (35 mg/mL = 215.8 mM) を 500 µL ほど入れても構いません。その場合、最終濃度は 100 μM 程になります。この FeCl3 試薬の中にはちょっとの微量金属が含まれています。そのためあえて微量金属を入れなくても、このコンタミ分で足りてしまうというわけです。できるだけ安い粗雑な精製試薬を買いましょう。

(14) 下のようなビタミン原液(フィルターにて滅菌処理)を加えてもよいでしょう。5mL の水(重水)に下記の 10 倍量を溶かし、フィルター処理します。10 本のエッペンドルフに分注し冷凍しておきます。そのうち1本分を培地 1L に入れます。

葉酸 (ビタミンM) 1 mg
塩化コリン (ビタミンB) 1 mg
ニコチンアミド (ビタミンB) 1 mg
D-パントテン酸 (ビタミンB) 1 mg
ピリドキサール (ビタミンB6) 1 mg
リボフラビン (ビタミンB2, G)0.1 mg
イノシトール 2 mg

10 mg は耳かき半分ぐらいの量です。一つ一つを秤で測らなくても、適当に入れて 5mL の水(重水)で溶かすことで問題ないでしょう。もちろん、上記の 100 倍量を測り取り、50mL の水(重水)に溶かして 100 本に分注しても構いませんが。。。

2018年7月12日木曜日

寒くても元気に

Hilser さんの論文がまた Nature に載りました。たいへん面白い内容です。

Saavedra, H.G., Wrabl, J.O., Anderson, J.A., Li, J., Hilser, V.J. (2018) Dynamic allostery can drive cold adaptation in enzymes. Nature. 558(7709), 324-328. doi: 10.1038/s41586-018-0183-2.

極限生物の中には高温と低温というお互いに逆の条件にそれぞれ適応して進化してきた生物がいます。化学反応の点でみると、普通は高温ほど反応速度が速くなりますので、高温に住んでいる菌ほど酵素反応が速くなりそうです。一般的に温度が 10℃ 上がるごとに反応速度が2倍になります(温度と速度は比例関係ではなくて「鰻登り」の指数関数の関係になります)。しかし、温泉に住んでいる菌も南極に住んでいる菌も酵素反応の速度はあまり変わらないはずです。もし住んでいる所の温度に従っていたら、温泉菌は超短命になっていたことでしょう。そこでどのように高温あるいは低温に適応したかですが、酵素の表面にある残基が変異したのに対して、基質が入るような重要な活性部位はあまり進化の上で変わっていないようです。活性部位は側鎖の微妙な位置関係によって成り立っており、進化上での try & error を通して作り上げられた精工品です。活性部位を触ってしまって活性がガタ落ちになった酵素はすぐに淘汰されてしまったのでしょう。すると、どうやって酵素の表面だけに起こった変異を遠く離れた中心の方の活性部位にまで影響させるのか(つまり、アロステリー)が問題になってきます。さもないと、表面は高温、低温に強いかもしれませんが、酵素反応はやはり高温で速く、低温で遅くといった状況になってしまいます。

著者らは大腸菌のアデニル酸キナーゼでこの謎を調べました。この酵素には3つのドメインがあります。LID-domain と AMP-結合 domain、そして両者に挟まれた CORE-domain です。当初は LID-domain と AMP-結合 domain の「基本的な立体構造」が進化の過程で変化して、回転数(turnorver:基質が入り生成物になって出て来る速度)を調整しているものと考えられていました。しかし、「基本的な立体構造」ではなく「ダイナミクス」が温度の変化を補償しているようです。

どうも LID-domain のフラフラ具合が酵素の基質に対する親和性を調整し、AMP-結合 domain のフラフラ具合が回転数を調整しているようです。ここで「やはり構造が変化しているではないか」と言われそうですが、あくまで「基底状態での構造 ground-state conformation」は変わっていません。ある瞬間にそれが励起状態の構造 excited-state conformation にパッと交換するのです。もちろん、その excited-state の構造は複数あり、その間でも行き来(交換)しているかもしれません。その意味ではこの構造交換もフラフラ具合と同じようなダイナミクスと考えてよいでしょう。

このような例は他の酵素でもしばしば見られます。基質が付いていない apo 状態では、2つのドメインが CORE ドメインに対してフラフラと動いています(open 状態)。基質が付くと、それらがひと塊になって rigid になります(closed 状態)。apo 状態のアデニル酸キナーゼの LID-domain も当初はこのひと塊のドメインとして「ドメインとしての構造を保ったまま」ヒンジを中心にして折れ曲がり向きが変化しているだけだと思われていました(rigid-body motion)。しかし、そうではなくて、どうも LID-domain だけがいわば局所的に unfolding するようです。

LID-domain は基質の結合部位を含んでいますので、このドメインが unfold すると基質との親和性が落ちます。そこで、Val を Gly に変異させました。Gly の方が自由に動けますので、unfold した状態でのエントロピー(位置のデタラメ度)が上がります。すなわち、自由度の高い unfold した状態に構造の平衡が移ります。実際に LID-domain が unfold した中間状態(I-state)のモル比が増えました。37℃ という室温では、野生体でこの I-state は 5% 程しか存在しませんが、Val→Gly 変異体では 40% ぐらいにモル比が増えました。そして、基質アナログとの親和性もやはり落ちました。一方、AMP-結合 domain の変異体については、基質の親和性に何らの影響も与えませんでした。

さらに NMR の CPMG 緩和分散法でも同じような結果が出ました。LID-domain は野生体でも apo 状態で構造交換しており、ほどけた構造(I-state)が 5% ほど存在するという結果です。LID-domain に変異がある場合は、このほどけた I-state のモル比が 40% ぐらいにまで増え、基質との親和性が落ちてしまいますが、温度を 10℃ ほど下げると野生体と同じようなモル比 5% にまで下がります。この仕組みを通して、住む場所の温度が変わっても Km 値がそれほど変わらないように進化の過程で変異しているようです。やはり、LID-domain は構造を保ったまま向きを変えるのではなく、unfold 状態になることによって基質との親和性を下げているようです。2004 年の Kern さんの論文(Nat. Struct. Mol. Biol. 11, 945)では、リガンドの結合に伴って LID-domain と AMP-結合 domain の両方が同時に扉を閉めて closed 構造になるようなイメージでした。由来する菌の種類が違うので、はっきりとした事は言えませんが、概念としては似ていると思います。しかし、異なる点は、それぞれのドメインが形を保ったまま動くのか、それとも unfold してしまうのかということです。

興味深いことに LID-domain の変異体は、活性(kcat)には影響を与えませんでした。kcat は基質が飽和状態にある時の反応速度、つまり全ての酵素分子に基質が付いている時の最大反応速度から見積もります。ですので、変異体が基質に対して低い親和性を持つようになったとしても(飽和するぐらい基質を大量に加えれば、全ての酵素が複合体になりますので)kcat の値は変わらないはずです。一方、AMP-結合 domain の変異体は野生体よりも活性が上がってしまいました。これは AMP-結合 domain がフレキシブルになることによって生成物を速く放出するためです。そして、これも温度を 10℃ ほど下げると野生体と同じような状態になりました。先程の繰り返しになりますが、この仕組みを通して、住む場所の温度が変わっても kcat 値がそれほど変わらないように進化の過程で変異しているようです。このことから LID-domain は親和性(Km)を、AMP-結合 domain は活性(kcat)を制御しており、両者はお互いに独立していることになります。しいては、kcat/Km 比もかなり似た値に保たれますので、基質で飽和していない時でも酵素の性能は温度につられてそれほど激変しない仕組みになっているのでしょう。別々の制御の方が相乗効果が生じますので、ちょっとの進化上の変異で、適応できる温度の幅を広げられるのかもしれません。

温度を変えながら反応速度を測定し、アイリングプロットというグラフを作ります。すると、活性化エンタルピーと活性化エントロピーの値を得ることができます。その結果、活性化エンタルピーは野生体と変異体とでほとんど同じでした。エンタルピー値は水素結合やファンデルワールス相互作用などさまざまな相互作用の変化を反映します(水素結合などを組むと熱が発生します。その熱は定圧条件下ではエンタルピーと同じになります)。したがって、遷移状態になる時の構造変化の度合いが変異の有る無しにかかわらず同じであることを意味しています。それに対して活性化エントロピーの方は、AMP-結合 domain の変異体が野生体よりも小さな値となりました。エントロピーは自由度の変化を反映します。生成物を放出するには AMP-結合 domain がフレキシブルになる必要があります。これがなかなか起こらないので、この AMP-結合 domain の柔軟性が酵素反応の律速となっています。しかし、AMP-結合 domain の変異体はすでに unfold 状態が多くなっているので(といっても動きが遅過ぎて CPMG では検出されていないようです)生成物の放出が容易になるのです。変異体ではすでに少し unfold しているため、完全に unfold した状態との自由度の差がそれほど大きくはありません。この差が自由度の差(つまりエントロピー差)ですので、AMP-結合 domain の変異体の活性化エントロピーは野生体よりも小さな値となるのです。

ここでちょっと不思議に思ったのですが、 LID-domain あるいは AMP-結合 domain がフレキシブルになった時に、それが酵素全体に与える影響が両者で逆になっています。例えば、高温になると AMP-結合 domain がよりフレキシブルになり、生成物の放出がより盛んになって活性が上がります。一方 LID-domain も高温でフレキシブルになりますが、今度は逆に基質への親和性を落とします。両者の影響がまるでお互いに相殺し合っているように見えます。ちょうど温度の変化を補償しているようです。シアノバクテリアの KaiA, KaiB, KaiC による体内時計にも温度補償性があるのですが、もしかすると、このように2箇所のダイナミクスの変化が蛋白質に与える影響がお互いに逆になるように組み合わせられているのかもしれません。

南極に住んでいるある魚類の乳酸脱水素酵素でも似たような特徴があるらしいです。その低温に適応した種の酵素を見ても活性部位の残基は変異しておらず、むしろ表面残基が Gly に変異しているそうです。低温にすると原子の動きが抑えられますので、一般的に fold した状態が安定化します(不安定な蛋白質の精製の時に冷やすのはそのためです)。しかし、この Gly への変異によってそのドメイン全体がフレキシブルになり、低温ではより rigid になってしまうことを相殺しているようです。この戦略により進化は大切な活性部位を危険を冒してまで変異させる必要はなく、活性部位から遠く離れたどこか表面の残基を Gly など小さく空間的にスカスカの残基に換えればよいわけです(ただし、その変異によってドメイン全体がフレキシブルになるような残基でないとだめですが)。要は、温度が変わっても動き(ダイナミクス)がおよそ同じ程度に落ち着くように、進化における変異が原子の充填具合を調整しているわけです。

また、著者らは最後に興味深いことを書いています。シャペロンはちゃんと fold しきれていないフレキシブルな領域を見つけてトラップします。今回のようにダイナミクスを変化させて酵素活性を調整しているような酵素では、温度が上がるとフレキシブルな箇所が増えてシャペロンに捕まってしまう確率が上がります。しかし、それによって細胞内全体でみると酵素活性が上がり過ぎるのを防いでいるのかもしれません。

2018年7月10日火曜日

共分散法 covariance

NMR スペクトルにおいて、共分散 covariance 法はこれまでのフーリエ変換 Fourier-transformation 法に代わるかもしれない プロセス法の一つとして注目を集めていました。最初は 2D 1H/1H NOESY, TOCSY などのように直接測定軸と間接測定軸が同じ種類のスペクトルにおいて、後者の分解能を前者にまで高める方法として提唱されました。その後、2つの異なるスペクトル(例えば (I, K) 相関スペクトルと (L, K) 相関スペクトル)の間で covariance をとることにより、(I, L) スペクトルを生成する方法として使われました。これは更に例えば主鎖帰属の HNCA と HNCOCA スペクトルなどにおいて 13Ca の化学シフトをもとに HN(i) と HN(i-1) を相関させるといった方法にも適用されました。

Harden, B.J., Frueh, D.P. (2018) Covariance NMR processing and analysis for protein assignment. Methods Mol. Biol. 1688, 353-373. doi: 10.1007/978-1-4939-7386-6_16.

Covariance の計算方法は実はたいへん簡単でして、上の例では (I, K) 行列と (K, L) 行列の内積をとるだけです。ここで後者の行列は転置しています。この共分散はフーリエ変換前の時間軸データでも、フーリエ変換後の周波数軸データでもどちらに適応しても構いません(細かな違いはありますが)。苦労する点といえば、4次元などのギガバイト大容量のデータに適用すると小さな PC が気の毒になる点ぐらいでしょうか?したがってプログラミングの FOR 文を使いまくるのではなく、できるだけ内積の高速演算ライブラリーなどを使ってコーディングした方が良いでしょう。

ただし、共分散法には false-positive な偽ピークが出てしまうという大きな欠点がありました。例えば、K 次元に沿ってちょっとだけずれた2つのピークがあったとします。目で見るとずれていることがすぐに分かるようなレベルでです。例えば、HNCA と HNCOCA とで 13Ca のピークが半値幅ぐらいずれていたとしましょう。この場合に、この2つのアミド基の帰属を相関させるような間違いは目視ではまず起こり得ません。ところが、共分散をとると、きっちりと相関を示す偽ピークとなってしまうのです。これでは使い物にならず、失望して止めてしまったものです。

ところが、最近はこれを克服する方法も出てきました。過去の論文にちらっと書いてあったことなのですが、共分散をとる前に微分をとっておくのです(もしかすると、分散波形でも良いのかもしれません)。すると、2つのピークが K 次元に沿ってぴったりと揃っている時に共分散が正の値を示し、逆に少しずれている場合には、共分散は小さな値、時には負の値を示します。これにより、false-positive な偽ピークを見分けることができます。

さらにエラーを減らす方法が提案されています。HNCA と HNCOCA とで K 次元に現れる 13Ca のピークをもとに HN(i) と HN(i-1) を相関させていったとします。しかし、この 13Ca だけだと間違いが多いでしょう。そこで普通は 13Cb, 13Co なども隣り合うアミド基を相関させるための共通の「糊」として使います。同じように (I', K') 相関スペクトルと (L', K') 相関スペクトルの間で covariance をとって (I', L') スペクトルを生成したとします。そして (I, L) も (I', L') も正の値のみを残しておいてから、両者を要素ごとに掛け合わせます。すると、いずれか一方に偽ピークがあった場合でも、掛け算によりそれは消えてしまいます。 (I, L) と (I', L') の両方に相関ピークがある場合にのみ、掛け算のスペクトルにピークが残るという仕組みです。ちょうど 13Ca, 13Cb, 13Co 全てを通して2つのアミド基どうしが相関を示した時に連鎖帰属を確定するのと同じです。二次元どうしですと、あまりメリットが感じられないかもしれませんが、3次元どうし((I, J, K) と (L, M, K))で K 次元に沿って共分散をとり4次元 (I, J, L, M) とすると、もしかすると有用かもしれません。もちろん今まで通りに処理すると多くの偽ピークが出てしまいます。しかし、covariance の前に K 次元に沿って微分をとり、covariance 後にスペクトルどうしを掛け合わせれば、上手く行くかもしれません。

Covariance や掛け算処理をする場合、各次元のデジタル分解能を合わしておくことは重要です。そのためには、同じマシンで同じスペクトル幅で一連のスペクトルを測っておきましょう。ポイント数は違っていてもスペクトル幅が同じであれば、0-fill 後のデータ数を同じ値にすることでデジタル分解能を調整することができます。異なるマシンで測った2つのスペクトルでは、いろいろなミスマッチが起こると考えられます。まず、マシンの絶対的な温度が異なります。さらにピークの位置も少しずれます。DSS のピークで 1H, 13C, 15N 次元を全て調整することでかなり揃えることができますが、それでも限界があります。本当は、HNCA と HNCOCA のペアなども interleaved-manner で測る方がよいのでしょう。それぞれを2日間ずつ連続して測定したとしても、それなりのずれは(ロックの不安定性などから)生じ得ます。

しかし、それでも false-positive な偽ピークが出てしまうそうです。これが起こるのはかなり線幅が異なるピークどうしで共分散をとった時です。例えば、HNCO では感度が高く大きな 13CO のピークが観えている一方、HN(CA)CO では感度が低く小さな 13CO のピークしか観えていないような時です。すると、共分散の前に微分をとったり、後に他の4次元と掛け算をしたとしても偽ピークが出勝ちです。そのような場合も想定して、一応は共分散をとる前のオリジナルスペクトルも少しチェックした方が良いとのこと(それでは covariance を活用する意味がないのですが)。また、4次元 (I, J, K, L) では (I, J) から (K, L) への相関と、その逆の (K, L) から (I, J) への相関の両方が共存しているかどうかを確かめることが重要とのことです。

ここで covariance の意味をあえて言うと、これまでの方法ではピークを拾い忘れていたり拾い方が悪ければ、それで終わりでした。拾った後の「化学シフトの値だけ」をもとに連鎖帰属をしていきますので、どのようにピークを拾うかが、その後の連鎖帰属の効率を決めているようなところがありました。一方 covariance 法では、false-positive が出る程に、そのような「拾い忘れ」が無いことが利点といえます。

いったい covariance という処理によって、スペクトルから何が失なわれてしまうのでしょうか?個人的にはピークトップの情報ではないかと考えています。人の目でピークを判断する時は、等高線で描かれた楕円の画像全体を観ながら、その中心をピークトップとして認識します。必ずしも最高強度の地点とは限りません。楕円が歪んでいたりすると、実はもうひとつ別のピークとオーバーラップしているのではないかと脳は推測したりもします。すると、その重なり具合に応じてピークトップの位置を少しずらしたりもします。初心者の場合、ここが欠点となってきます。covariance をとる前に微分するという処理は、ちょうどこのピークトップをできるだけ目立たせようとしていることに相当するのではないでしょうか?微分値ではちょうどピークトップの箇所で大きく正負が入れ替わります。そのため、どれぐらいの幅で微分(差分)をとるかも重要な要素になってくるだろうと考えられます。このような点が議論されているかとも思ったのですが、下記のオリジナル論文も含め見つかりませんでした。

Bradley J. Harden, Scott R. Nichols, and Dominique P. Frueh (2014) Facilitated assignment of large protein NMR signals with covariance sequential spectra using spectral derivatives. J. Am. Chem. Soc. 136 (38), 13106–13109. DOI: 10.1021/ja5058407.

2018年6月24日日曜日

生きた博物館

過去に何かの記事で NMRBox を紹介しましたが、また改めて。

これは NIH からのサポートを受けている一種のクラウドシステムです。サーバにはいろいろな NMR に関するソフトがインストールされています。たいへん興味深いことは、もう古くなって使えなくなってしまったようなソフトもそこでは生(活)きていることです。もちろん今でも優秀なソフトはどんどん開発されてはいますが、どうしても新しいトピックスをテーマとしたソフトとなってしまっており、いわゆる古典的な機能をもったソフトが、気が付いたら消滅してしまっているということがよくあります。しかし、この NMRBox ではそのようなソフトが使えるのです。まるで博物館です。

また、non-uniform sampling で測定した4次元データなどは、プロセスするのも大変です。そもそも私のところも Windows-XP の古い PC などを Cent-OS linux などに使い回しているものですから、四次元 NUS をプロセスするとなると今でも大変です。さらに PC も古くなってくると、突如として壊れます。もうこの半年で3台が去ってしまいました。なんとかデータだけは Puppy を使って幸運にも救出できてはいるのですが。一方、NMRBox には NMRPipe の IST や Smile がありますし、メモリーも H/D も豊富に備えていますので、そのような資源について心配する必要はありません。つい先日まで四次元 NUS の Smile によるプロセスが自分の PC ではメモリー不足でうまく行かなかったのですが、やっと NMRBox でうまくいきました。

また、夜帰宅してからでも週末でもプロセスの続きを見たり、ピークを帰属することができます。実際にプロセスしているコンピュータはきっと NIH にあるわけで、そのディスプレーを Real VNC viewer を使って見ていることになります。家でも職場でも出張中でも講演中でも NMRBox にアクセスできるということは素晴らしいことです。

ちょっと変わった使い方ですが、環境のセットアップをうまく出来ない人がいた時に、こちらで NMRBox にログインして環境を整えてあげることができます。例えば、連鎖帰属に必要な全ての3次元4次元スペクトルをまず関連付けます。二次元 HSQC のピークをクリックすると、自動的に3次元4次元の対応するピークに飛んでいくように設定しておきます。その後でその人がログインすれば、もうすでに帰属のための環境は整っていますので、後は実際の帰属作業に集中してもらうことができます。これまでは、わざわざその人の PC のところに行って環境を整えていましたので、それが出来る時間が何かと限られてしまっていました。4次元を何個もセットアップしようとすると何日も通わないといけませんでした。しかし、今は自宅からセットアップできます。また、担当者が代わっても、次の人は環境をそのまま引き継ぐことができます。面白いことに2箇所から同時にログインすると、他者の作業の状況をリアルタイムで見ることができます。まあ、同時に同じピークをピックしないように気を付けないといけませんが。。。。ちょうど OneDrive や GoogleDrive を他人と共有しながら、一つの Word ファイルを同時に編集しているような感じになります。

惜しい点は、どうしても画面を日米間で転送するので、ちょうど国際電話をかけている程度の時差が生じてしまう点です。1秒以内なのですが。vi でテキストファイルを編集していると、どうもカーソルが1秒ほど遅れて着いて来るため、希望する行を行き過ぎることが多いです。まあこの辺りは仕方がないですね。

できれば、Cyana, MagRO, Topspin も入っていれば言うこと無しなのですが。Topspin はどうしても立ち上がらず、管理者に問い合わせたら、ちょっとしたミスマッチでもう少し待って欲しいとのことでした。期待したいと思います。Bruker さん、どうかよろしくお願いいたします。

1時間程前にスタートさせた四次元 NUS のプロセスが順調に進んでいるようです。それでは明朝の結果に期待して、そろそろお休みしたいと思います。もちろん私の PC の電源は切ってもプロセスは続きます。zzzZZZZ

2018年5月26日土曜日

今だに位相補正で苦しむ

何でもない NMR 実験のはずが、そのプロセスで意外にも時間を費やしてしまいましたので、その覚え書きとして残しておきます。その測定とは HCCH-COSY です。ちょっと高分子量の蛋白質になってくると、CCONH や HCCONH での側鎖のピークが急に観えなくなります。そこで、HCCH-COSY などアミド水素にまで磁化を移動させない方法で側鎖の帰属を試みました。

三次元の HCCH-COSY と言っても、FID としての直接測定軸(x)を除いた y, z 軸がどれに当たるのかが問題です。今回は HCcH-COSY と hCCH-COSY をとってみました。小文字の箇所が検出をスキップする核種を示しています。4次元に拡張すると間接測定次元をどの 1H, 13C に当てるかという問題はなくなるのですが、やはりそれなりに感度が必要になってきます(次元が一つ増えるごとに感度がルート2に反比例して落ちる)。

ところが、Br 社のパルスプログラムでは、どの HCCH-COSY が上記の各々に当たるのかをすぐには見つけられません。パルス図を見て初めて、そうか HCcH-COSY が hcchcogp3d で hCCH-COSY が hcchcogp3d2 だとやっと分かります。プログラムの後ろの「2」は、新旧のバージョン番号を示しているのだと思っていましたが、そうではありませんでした。

日本では地震が多いため、最近は皆? NUS で測定します(たとえ 100% sampling であったとしても)。地震で変になった箇所のデータを後から除けるためです。それに私は窒素やヘリウムを入れるスケジュールをすぐに忘れて測定をスタートしてしまうので、三次元測定の最中にやむなく測定を止めないといけない事もしばしばです。そのような時に NUS で測定していると、一応は途中までのデータを捨てずに有効活用することができます(もちろん感度は落ちますが)。また、重水素デカップリングをかけた実験の場合には、NUS にしないと autoshim との干渉が起きてしまい、翌朝にはロック信号が底辺をごそごそと蠢いているという事態を見ることになります。

さて測定が終わり、まずは hCCH-COSY (hcchcogp3d2) をプロセスすることにしました。ここで困ったことはパルスプログラムには aqseq 312 と書かれていることです。これは F3, F1, F2 の順にサンプリングすることを意味します。In0=Inf1/2 という表現から F1 には D0 インクリメントが対応しており、in10=inf2/2 という記述から F2 には D10 インクリメントが対応していることが分かります。FID での検出(F3)を Hi とすると、D0 が 13Cj に D10 が 13Ci に対応することもパルスプログラムで調べておきます。さて aqseq 312 ですので、NMRPipe の fid.com では y と z のカラムがひっくり返るはずなのです(と思い込んでいました)。しかし、実は NUS の場合にはきっとこれが起こらないのです。というのは、NUS では y と z のどちらを先にインクリメントするのかという概念がそもそも無くなるためです。それに nuslist でも y と z のインデックス番号のカラムをひっくり返してはいませんでした。しかし、それに気付かずに fid.com での y と z カラムをわざわざ交換してしまいました。普通でしたら間違いにすぐ気付くはずなのですが、この時は y, z ともに 13C 軸なので違いがすぐには分からないのです。

こうして、Hi を横軸に Cj を縦軸に二次元として表示すると、スライス軸は Ci になります。するとピークが Cj 次元軸に平行に点々と縦に並ぶはずです。実際には感度が悪くて並ばなかったので、ますます気付けなかったのですが。中には何故 Hi と Ci を二次元表示しないのかと不思議に思われる方もおられるかもしれません。感覚的にはその方が分かり易いかもしれません。4次元ではどの軸を後ろに持っていくかはさらに興味深い問題です。理屈よりも実際に試してみてその時の良し悪しを実感してみた方が面白いでしょう。将来は目の前の空間に球が浮かんだような感じの表示(ホログラム)になるので、今のような議論は消えるでしょう。ホログラムで四次元はどう表示するのかは問題ですが。

次に HCcH-COSY (hcchcogp3d) のプロセスです。これは更に悲惨でした。F1 が 1Hj に F2 が 13Cj と異なる核種に対応しているので、両軸をひっくり返してしまうという間違いはないのですが、F1 軸は TPPI-States に加えてちょっと特殊な位相回しが入っていました。パルスプログラムの下の方に calph(ph3, -90) という記述があります。これは D0 をインクリメントした時に ph3 を 90 度逆に回すことを意味します。せっかく TPPI-State で x から y に +90 度進めたのに何故また逆転させるのか?これは一種の TPPI 法に似た概念を利用していまして、TPPI-States を基本としながらも、さらに t1 インクリメントごとに観測座標を 1/4 回転だけ逆に回すのです。すると、磁化ベクトルがスペクトル幅の 1/4 だけ遅く回っているように見えるのです。これを FT する際にはスペクトルの中心をスペクトル幅の 1/4 だけあえて高磁場側に移します。HCCH-COSY ではアミド水素は観えませんので、4.7ppm から低磁場側はほとんど必要なくなるのです。その代わり環電流シフトを受けたメチル基なども検出するために高磁場側までスペクトル幅を広げる必要があります(ピークを折り返してやってもよいのですが、ややこしくなりますので)。

普通はこのような場合、周波数シフト fq を施して 4.7 から 3.0 ppm ぐらいに中心周波数を移せばよいのですが、何故 Br 社はあえてこのような奇妙な方法をとっているのでしょう?しかし、まあここまではよくあるパターンでした。ところが hcchcogp3d をよく見ると、d0=inf1/4 と書かれています。Br 社にしてはめずらしい。これは t1 の初期値を t1/2 に設定することによって、折り返しのピークを負に逆転させる方法です。昔はこれしか使わなかったのですが、もう最近はスペクトル幅を広くとって折り返しをあまり利用しないようになってきました。それで NMRPipe の位相を ph0=-90, ph1=180 に設定しました。Topspin では 90, -180 なので、これも記憶がごちゃごちゃになってしまう要因です。さらに echo-antiecho のプログラムによっては ph0=0 もあり得ます(足し算と引き算の結果のどちらを虚数側に選ぶかで変わってくる)。

ところがスペクトルを見てみると、かなり位相がずれているのです。そもそも NUS データに普通の FT を施して位相だけを観ようとするのですから悲惨です。めちゃめちゃな位相のピークが羅列しているのです。しかも軽水溶媒で測定したので、水のベースラインのうねりもかぶってきて、もうまるでゴミが一杯浮かんだ昔の荒れた大阪湾のような情景です。HCCH-COSY も普通の COSY のようにピークが桜模様になるんだっけ?と思いながら(そんなことはありません)ph0 = 0, 90, ph1=180, -180 さらに F2 の方が狂っているのかもと F2 も同様に変えると、その組み合わせだけで 16 通りです。この間違いに気付くには一晩を要したのですが、実はスペクトル中心を 1/4 だけずらしているので、ph0 も 1/4 だけずらさないといけなかったのです。何の 1/4 か?もちろん ph1=180 の 1/4 です。したがって、ph0= 90+180/4=135, ph1=180 が正しかったのです。NUS でなければ、マニュアルで位相補正した際に何気なく気付くのかもしれませんが、NUS データでは FT 後のデータは錯乱状態ですので、その中でかろうじてピークの姿を醸し出しているのを選んで位相調整することになります。もう二度目の間違いはごめんですので、ここに覚え書きしておいて次は参照することにします。

ところで4次元の NUS のプロセスについてですが、自分の PC で行うと2日経っても終わらず、さらに Word すらも重い状況になってしまいました。しかし、NMRBox を活用してから、その問題が一挙に解決しました。NMRBox は一種のクラウドで、無料で過去のさまざまな NMR ソフトを活用できます。先日もちょっと質問を送ったところ、翌日には回答が返ってきました。もう本当に「ありがとう!」です。おかげで4次元に躊躇しなくなりました。

2018年5月4日金曜日

2匹でやめておきたい時

何気なく今まであやふやにして誤魔化していたことを少し確かめてみました。どのような実験であれ誤差を出さないといけません。英語では uncertainty, standard deviation (sigma), error bar, root mean square deviation (RMSD) などと表します(細かな違いがあるとは思いますが)。ここでは(平均値)+- (1標準偏差)を表すことにします。「プラス・マイナス」にご注意ください。しばしばエラーバーの長さは?と尋ねられ、プラスもマイナスも含めた全体のバーの長さのことなのか?それとも正か負か片方だけの長さのことなのか?で迷います。前者は後者の2倍の長さになります。しかし、以下では後者の方(片方だけの長さの絶対値)を指すことにします。

もし実験を 100 回も 10,000 万回も繰り返すことができれば、それらの値を統計処理して、(平均値)+- (1標準偏差)を出すことができます。これが実験の上ではもっとも正確な誤差でしょう。しかし、一回の測定に云百万円もかかるとすると、せいぜい2回程度(1回?)しかできないことになります。この2回の実験で得られた値を使ってエラーバーを書いてもよいのかどうか?という点が長らくの疑問でした。

ここから下に書く内容は、次のことと多いに関係しています。標準偏差を出す時の手順です。まず、データ a が 10 個あるとすると、その 10 個の平均値 v を出します。そして、それぞれのデータ a から v を引きます。さらにそれぞれの差 (a-v) を2乗します。それらの値 (a-v)^2 を足して n=10 で割ります。これを分散と呼びますが、最後にこの分散のルート(平方根)をとれば標準偏差になります。(標準偏差)= Sqrt(分散)sqrt とは root のことで、しばしば数学のプログラムで使われています。

この処理はちょうど RMSD と同じです。RMSD は後ろから読んでいきます。D は differnece ですので差です。つまり、平均値 v からの差をとります (a-v)。Square は2乗です (a-v)^2。Mean は平均です。R は root です。よって「RMSD = 標準偏差」になりそうな気がします。

ところが、標準偏差の式をいろいろと調べてみると、(a-v)^2 を全て足すところまでは良いのですが、その後 n で割るのではなく (n-1) で割っている式も時々出てきます。昔から不思議だったのですが、この (n-1) はいったい何?

実は Wikipedia に答がちゃんと書かれていました。無限回数の実験をこなした時(いわば理想的な状況)での標準偏差と、事情により数回の実験しかできなかった時(現実的な状況)での標準偏差のことでした。そして、

無限回数での分散 : 限定回数での分散 = n : n-1

となるのだそうです。標準偏差を2乗すると分散になりますので、上記の公式をルート(平方根)すると標準偏差の式にそのまま変身します(しかし、そうとも言い切れないので下記を参照してください)。

ここで現実的な状況を考えてみましょう。分散を計算する時に n で割り算したとします。つまり (R)MSD の計算と同じです。すると、それはあくまでその限定された回数における分散であって、仮に無限回数実験をしたと仮定した時の分散値よりも小さくなってしまうということです。それでは、少ない回数であたかも無限回数実験したかのように計算するにはどうすればよいのか?n で割るのでなく (n-1) で割るということになります。すると、ちょっと大きめの値が出てくると思います。これで良いのだそうです。なぜ (n-1) で割ってちょっと大きめにするかは、調べてみるといろいろ載っていましたが、ここでは複雑ですので記さないことにします。

よって数匹の鼠 n=3 でしか実験しなかった状況で (R)MSD をまじめに計算すると(3で割ると)、もし1億匹の鼠 n=100,000,000 で実験したと仮定した場合の (R)MSD よりも小さめの値が出てしまうということです(n-1=2 で割るとよい)論文にそのようなエラーバーを出すとこれはデータを都合の良い方に解釈したことになり、データ捏造になるのでしょうか?

ややこしい問題は使っているソフトにもあります。もし、そのソフトの標準偏差のツールが、すでにあえて n ではなくて (n-1) を使っていたとすると、その標準偏差は無限回数への拡張を想定していたことになります。一方、RMSD のように n で割っていたとすると、それはその制限回数内のみでの標準偏差を表していることになり、ちょっと小さい値なので得をします。実験を数多く繰り返して n を大きくすると、n と (n-1) の違いが小さくなってきますので、両者の RMSD はどんどん似てきます。

n と n-1 が問題になってくるのは n の値が小さい時です。可哀想な話ですが、もし鼠 100 匹で実験したとすれば、無限回数と制限回数での標準偏差はたったの 0.5% しか違いません。もし、n=10 ですと 5% ぐらいです。幸いうちではバクテリアしか使いませんので、制限されているといえどもすでに数え切れない位の大きな n と言えます。

さて、問題は2回しか実験しなかった場合です。ソフトによってはエラーバーの大きさが 1.4 倍(sqrt(2))違ってきますので、ちょっと問題です。

2つのデータ a, b があり、それの RMSD を計算しました。v = (a+b)/2 ですので、(a-v)^2 と (b-v)^2 を計算し、これを足して2で割ります。最後に平方根をとります。Mathematica で

Simplify[Sqrt[Mean[{(a - Mean[{a, b}])^2 , (b - Mean[{a, b}])^2}]]]

と打つと、これが abs(a-b)/2 と同じ値であることが分かります。abs とは絶対値のことです。

一方、2個のデータから無限回数を想定して統計をとるとすると、標準偏差は abs(a-b)/sqrt(2) となり、先ほどの2個だけで閉じた標準偏差よりも 1.4 倍だけ大きな値になります。この値をしぶしぶ文献に載せるべきでしょうか?

Simplify[Sqrt[Plus[(a - Mean[{a, b}])^2, (b - Mean[{a, b}])^2]/(2 - 1)]]

では Excel ではどうなっているのだろう?と気になり、調べてみるとちゃんと2個の関数が別々に定義されていました。具体的には 5.3 と 9.2 という2個の数値を使いました。STDEVP 関数は n を使っているので 1.95 となりました。一方 STDEV は n-1 を使っているので 2.76 となりました。両者は 1.4 倍違います。ここでは 1.95 を使いたいところですが、ちゃんとプラスマイナス 2.76 の長さのエラーバー(合計長さは 2.76*2)を記載しました。P は parent の P です。限定された少ない標本を選び出してきて、その少ない数があたかも母集団そのものである(他にデータは何もない)と考えるとよいのだそうです。

本当にこれで良いのかどうかを確かめるべく、シミュレーション実験してみました。乱数が正規分布になるようにしました。例えば(平均値3, 標準偏差2)になるような乱数を 10,000 個発生させました。つまり、10,000 万回実験したことになります。次に任意の2個を抜き取ってきます。これが実際には2回しか実験できなかったことを意味します。そして、この2個の数値を処理した時に果たして(平均値3, 標準偏差2)になるかどうかです。

まず平均値3については、まったく問題なく再現できました。もちろんたまたま選び出した2点の平均値は3からずれています。そかし、それを多数回おこない、それらの平均をとると3に極めて近づきました。しかし、標準偏差2についてはちょっと上記で理解したこととは異なってしまいました。

実際に任意の2点の差の絶対値をたくさん求めてみた結果、その平均値は 2.27 になりました。つまり、ルート2で割る必要がないぐらいです。それではと中央値 median をとってみると 1.93 でした。これもルート2で割るまでもありません。それでは2点の標準偏差はどうなるのかと思い計算してみました。Mathematica の StandardDeviation 関数のですので無限回数を想定しての標準偏差(n-1=1 を使っている)です。その平均値は 1.60 でした。ますます変な値になることは分かっていながら RMSD を計算してみました。n=2 を使う方式です。これは 1.13 と、やはり予想どおり小さな値(1/1.4)になってしまいました。

これはおかしいなと思い、また Wikipedia をしっかりと見てみると答が載っていました。

分散の場合
 無限回数での分散 : 限定回数での分散 = n : n-1
標準偏差の場合
 無限回数での標準偏差 : 限定回数での標準偏差 = sqrt(n) : sqrt(n-1.5)

これはややこしい。単純に平方根をとればよいと思っていたのに、無限回数を想定した分散と標準偏差とでは計算の仕方が違うのだそうです。前者は n-1 で割り、後者は n-1.5 で割ると理想値に近づくのだそうです。n=2 のとき (n-1.5) = 1/2 になります。そのようにして2個の標準偏差を計算すると、ちょうど差の絶対値と同じ値になります。

Simplify[Sqrt[Plus[(a - Mean[{a, b}])^2, (b - Mean[{a, b}])^2]/(1/2)]] は Abs(a-b) と同じです。

以上から言えることは、2点間の差の絶対値をそのまま1標準偏差 s にするとまずまず良いのではないかということです。平均値を v とすると、無限回数測定したと仮定した場合の統計は v +- s となります。n=2 以外の場合、STDEVP 関数で計算した値には sqrt(n/(n-1.5)) をかけ、STDEV 関数で計算した値には sqrt((n-1)/(n-1.5)) をかけて補正すればよいのでしょうか?ややこしいです。

2018年4月27日金曜日

ファンデルワールス相互作用を観る

今までも水素結合 (1999 年), CH/π 相互作用, 静電的相互作用に J-coupling が見つかり NMR で、その相互作用による交差ピークが検出されてきましたが、とうとう蛋白質 GB3 でも van-der-Waals 相互作用が検出されたようです(低分子ではすでに見つかっていた)。

Li J, Wang Y, An L, Chen J, and Yao L. (2018) Direct observation of CH/CH van der Waals interactions in proteins by NMR. J. Am. Chem. Soc. 140, 3194-3197. doi: 10.1021/jacs.7b13345.

NMR 測定では 2D 1H-13C HMQC を利用しています。メチル基の 1H から 13C1 に磁化を移動させて 2C1yHx を作った後 125ms (2T) かけて J(CC)-coupling を展開させます。すると、2C2zC1x が少しできます(Hx がずっと付いてくるのですが、ややこしいので以下では省略します)。そこに位相 y で 90 度パルスを 13C にかけると 2C2xC1z となります。最初の 13C1 から J-coupling した 13C2 へと磁化が移動したわけです。いわゆる 13C-13C の COSY です。その2個目の 13C2 の化学シフトを t1 で検出した後、もと来た道を戻ります。そして1個目の 13C1 に付いた 1H の FID を検出します。試料はメチル基のみが 1H 化、それ以外は 2H 化されています。

水素結合での J-coupling の検出(3D HNCO)においてもそうですが、ピークを少しでも観ようとすると、とにかく J による展開時間 2T を長くとならないといけません。そのため大きめの蛋白質になると、今回の場合は 13C の横緩和のために急に信号が観えなくなってしまいます。今回、横磁化になるのはメチル基の 13C ですので、交差相関緩和(methyl-TROSY 効果)によって横緩和時間がかなり長くなっています。

行きの磁化移動を三角関数を使って表現すると以下のようになります。

交差ピーク:C1y → 2C2zC1x * sin(pi*J*2T)
対角ピーク:C1y → C1y * cos(pi*J*2T)

交差ピークと対角ピークの比をとると tan^2(pi*J*2T) となります。tan が2乗になっているのは行きと帰りの磁化移動が二重にかかってくるためです。そして、実際のピークの強度比をこの式に当てはめると J-coupling の値は 0.1-0.5 Hz ぐらいの大きさになったそうです。2T = 150 ms ほど取ったとしても tan^2(pi*J*2T) =0.06 ぐらいの小ささです。

どうもこのような測定を見ていると、もしかして 13C と 13C の間の NOE がアーティファクトとして入って来てはいないだろうかと勘ぐってしまいます。もちろん NOE が起こるためには 13C 磁化が縦 z 方向にないといけないのですが、いずれのパルスも完全とは言えませんので、どうしても縦磁化が少し混じってきてしまいます。それらは位相回しやグラジエントできっちりと消してやらないと、13C-13C NOE が観えてしまいます。また、1H-1H NOE は重水素化している蛋白質では起こらないはずですが、これもパルスの不完全性と重水素化の不完全性から生じてしまうこともあります。上記のように 2T を変えた時にピークの強度比が tan^2 の曲線に載ったので、おそらく J-coupling によるものと思われます。

J-coupling は隣り合う原子間でそれらの電子雲が重なっていると生じます。量子力学計算によると、CH3-CH3 の方が CH-CH に比べて炭素間の距離は短くなるようです。CH-CH の場合は C-H-H-C と一直線になるのに対して(直線配置)、CH3-CH3 では両者からの水素原子が組み合わさったような構造(交差配置)をとるためのようです。DFT 計算によると、この J-coupling の大きさは C-C 間距離が狭くなるほど大きくなるようです。蛋白質はできるだけパッキングした構造をとろうとするので、CH3-CH3 の交差配置の構造の方を採りやすく、そのため J(CC)-coupling も大きく出そうな気がします。しかし、同じ距離ならば、C-H---H-C と直線に並ぶほど J は大きくなるのだそうです。その方が電子雲の重なりが大きくなるためですが、重なりが大きいほどお互いに反発し合って蛋白質の構造の点では不安定になります(交換反発エネルギーが大きくなる)。これらの特徴のために、今回の感度では全体の 40% ほどしか J が観えなかったのかもしれないと著者らは分析しています(蛋白質は電子軌道の重なりを避けて反発力が小さい最密充填構造をできるだけ採ろうとするが、その結果、小さな J-coupling となってしまう)。このように距離や角度に依存する点は水素結合での J-coupling の特徴と似ています。

2018年3月24日土曜日

ほどけたままくっ付くらしい

正電荷をたくさん持ったある蛋白質と負電荷をたくさん持ったある蛋白質とが、いずれも決まった構造をもたずに、お互いに相互作用していたというお話です。

Borgia, A., Borgia, M.B., Bugge, K., Kissling, V.M., Heidarsson, P.O., Fernandes, C.B., Sottini, A., Soranno, A., Buholzer, K.J., Nettels, D., Kragelund, B.B., Best, R.B., and Schuler, B. (2018) Extreme disorder in an ultrahigh-affinity protein complex. Nature 555(7694), 61-66. doi: 10.1038/nature25762.

細胞(核)内の雑多な環境内にあるにもかかわらず、その二つは相手を見つけて?遠くからどうしでも相互作用します。両者ともに intrinsically disordered proteins(IDP)です。普通は相互作用した途端に induced fit 等が起こって決まった特定の立体構造に固まり、いわゆる鍵と鍵穴のような相補的な関係によって噛み合うものと期待します。しかし、今回の例では相互作用してもお互いに特定のアミノ酸どうしで組み合うわけでもなく、両者がフレキシブルに動いたダイナミックな状態で相互作用していたということです。特定の鍵と鍵穴の間の立体構造の関係によらない、このような相互作用でしたので、Nature に採り上げられたようです。

正電荷の蛋白質:linker histone H1.0 (H1) +53
負電荷の蛋白質:prothymosin-α (Pro-Tα) -44

しかし、それでもあの雑多な中で相手を間違えないというのは驚きです。普通は鍵と鍵穴の相補的な関係を通して「特異的に」相互作用します。もし、両者の立体構造が噛み合わなければすぐに離れてしまい、複合体は相互作用と呼べるほどの滞在時間を保てません(koff が大きい)。もちろん、この二つの蛋白質の電荷の絶対値は両者ともにかなり大きいですので、強い静電的相互作用によりお互いに離れないのでしょう(pM の解離定数をもつ)。また、静電的相互作用は疎水的相互作用よりも遠くまで及ぶので、この2つの蛋白質が少しぐらい離れていてもお互いに引き合うのでしょう。

ただし、本文には次のように書かれています。このように決まった構造をとらずに相互作用する目的は、非常に強い親和性を持ちながら、それでもなお速く付いたり離れたりする必要があるためと。たしかに Pro-Tα はリンカーヒストン H1 のシャペロンですので、H1 がクロマチンと相互作用する時の親和性に競合するほどの親和性を H1 に対して持っていなければなりません。しかし、Pro-Tα がずっと H1 に付いたままですと、H1 をクロマチンから離して次の場所に再配置するといった「交換」を行えません。遠くからでも効く高い親和性をもちつつ、高速に付いたり離れたりするには、このような静電的相互作用と同時に disorder が必要なのだと書かれています。この考察は個人的にはちょっとよく分かりません。それよりかは、クロマチンも含めた3者複合体を作った時に初めて induced-fit が起こるのではないだろうか?第三者とはクロマチン、修飾酵素などが考えられます。例えば Pro-Tα:H1 には複数の複合体の形があり、次にやって来る第三者の(鍵)構造に応じて、そのうちのどれかの(鍵穴)構造が選ばれる(population selection)。しかし、NMR も含め現在の物理的計測法では、この複数の、しかも速く入れ替わっている構造を区別してとらえることは難しく、全ての構造の相加平均として計測されてしまっているのではないだろうか?と想像してしまったりもします(CD の値や 13Ca の chemical shift deviation が複合体の形成の前後であまり変わっていないので、やはり disorder したままなのか?あるいは、大半は disorder していても、実は第三者が来た時にピタッと当てはまる鍵穴構造がいくつか含まれているのかもしれません。そのモル比が小さいので、相加平均をとると disorder に見えてしまう?)。

細胞内には他にも電荷をたくさんもった蛋白質や核酸成分があり、それらが無差別に(非特異的に)くっ付いて来て離れなくなってしまっても良さそうです。もちろん、教科書にも載っているように、核内で局所的に存在したり、ある時期にだけ特別に発現したりしているのかもしれません。これについては、同じ号の

Tight complexes from disordered proteins (NEWS AND VIEWS) Berlow, R.B. and Wright, P.E.

に次のようにコメントされています。

"Pro-Tα and H1 form an archetypal fuzzy complex that involves a large ensemble of possible bound protein conformations, many of which are adopted by only a small number of individual complexes and occur with approximately equal probability."

相補的に噛み合った立体構造の箇所(とまでは明記されてはいませんが)が存在するのだが、ある瞬間をみると、そのフィットし合った領域はたいへん狭く、その領域は時間が経つと共にあちこちに移ります。H1 のある一つの狭い領域が Pro-Tα のある一つの狭い領域といつも1:1で相互作用しているのではなく、 H1 の複数の狭い領域と Pro-Tα の複数の狭い領域とが、いろいろな組み合わせでお互い交代しあいながら相互作用しているのかもしれません。しかもその小さな領域どうしが結び付いている時間は全てが同じぐらい短いのでしょう。すると、それらの複合体の構造がお互いに素早く交換していくので、観察者にはフレキシブルに動きながら非特異的に相互作用しているように観えるのかもしれません。そして、常に余った正電荷が H1 にあるために(Pro-Tα の負電荷によって H1 全ての正電荷が同時に相殺されるわけではない)、H1 がクロマチン(負電荷)とも相互作用できるのかもしれないと書かれています。

核内にある仁(核小体)は、何か膜のようなもので囲まれているわけではなく、蛋白質と核酸が相互作用し合いながら寄り集まっています。これは液-液相分離と呼ばれていますが、このような相互作用も上記のような仕組みで起こっているのかもしれません。ただし、今回の H1:Pro-Tα の系では濃縮しても液-液相分離は起こっていません。著者らは、ちょうど長さの点でも電荷の点でも2者間の相互作用でお互いに打ち消し合うような関係にあるためではないかと推察しています。また、もし疎水的な残基や芳香環がもっとあれば、これにさらに疎水的相互作用やカチオンパイ相互作用などが加わり、液-液相分離に進んでいくのかもしれないと書いています。

そもそも2つの蛋白質はお互い遊離状態であっても複合体状態であっても CD スペクトルがほとんど変わりませんでした。ということは、二次構造(特に α ヘリックス)の量は、複合体になったからといって増えているわけではありません。これ以上の構造情報を得ようとすると(結晶は当然のように出来ませんので)NMR しかありません。しかも二次元 1H-15N HSQC だけでかなりの情報が得られます。大腸菌発現系であれば、15N 標識蛋白質の発現が比較的容易にできます。IDP の二次元 1H-15N HSQC スペクトルは特徴的でして、横軸(1H)の 8.6 ppm より左にピークが現れません。これは「ハムの壁」と呼ばれています(この語呂は日本語だけで成り立ちます)。H1 には一部 fold した領域がありますので、そこのアミノ酸のアミド 1HN からのピークのみ 6-12 ppm 範囲に散らばります。一般的に水素結合が強いほど大きな 1H 化学シフト値(スペクトルでは左側, 低磁場側)をとる傾向があります(NMR では、軸の向きが常識とは逆になっていることに注意)。

ここで、2つの蛋白質を混ぜ合わせると、両者ともにピークが移動しました。一般的に電荷や芳香環をもった相手方リガンドが近づいてくると、化学シフト値が大きく変わります。しかし、この混合で移動したピークが一面に散らばる方向に動けば、複合体を形成した際にはっきりとした立体構造が誘導された(induced-fit)と分かりますが、移動したピークも依然せまい領域に固まっていました。つまり、二次構造の量が増えたわけでもないのです。また、13C の化学シフト値は二面角の大きさに強く影響を受けますので、二次構造の判定にしばしば使われます。しかし、その 13Ca の化学シフト値を見ても、α ヘリックスや β シートが誘起されたようではありませんでした。

このように帰属をしなくてもかなり詳しい構造情報が NMR から得られます。もし、15N, 13C で二重標識できれば、それぞれのピークがどのアミノ酸由来であるかを帰属できますので、もっと細かく調べることができます。実は、IDP の帰属は技を使えば可能な場合が多いのです。なぜならば、主鎖、側鎖が揺れ動いているために見かけの分子量が小さくなったような効果が生じ、感度が著しく上がるためです。複合体のスペクトルで、H1 の globular-domain からのピークが消えたのは、まさに溶液内での回転運動が遅くなったためです。しかし、それでもフレキシブルな、構造をとっていない領域は観測が可能でした。もちろんピークは全体的に強度が下がったそうです。さすがに複合体の状態では、単量体でいる時よりも回転運動が遅くなったのでしょう。また、反対の電荷どうしの相互作用が速く入れ替わったので、Rex も大きくなったのでしょう。

「技」というのは高次元化や高分解能化です。つまり、多くのピークがスペクトルの狭い領域にひしめき合うので、分解能を上げた測定をしてあげる必要があります(普通の蛋白質と同じパラメータで測定すると失敗します。それこそ non-uniform sampling, NUS が有効でしょう。さらに帰属の作業には少しばかりの根気が必要)。しかし、感度さえあれば、この高分解能化を達成する方法はいろいろと紹介されており、むしろ NMR の超複雑な最新パルス技術とプロセス技術を存分に発揮できますので、オタクにとっては実は嬉しい系であったりもします。

2018年3月22日木曜日

渡り鳥

渡り鳥がどうして道を間違えずに地球を半周ほども回れるのか?という話についてです。当然のように方位磁石(コンパス)*1 の代わりになる何かを持っているのでしょうが、それが何でどのような物理的原理によるのか、よく分かっていません。個人的に興味を持っていて、このような記事をたびたび拾い読みします。もっともよく登場するのは、網膜にある cryptochrome(クリプトクローム)と呼ばれる蛋白質です。

*1) ある種の細菌は磁鉄鉱をもっており、実際にそれが方位磁石のような働きをするそうです。鳥類にも磁鉄鉱が見つかるのですが、コンパスの働きはないとされています。

今回は驚いた事に、DNA 修復酵素の一種である光回復酵素が、このコンパスの働きをしているかもしれないという記事が出ました。

Zwang, T. J., Tse, E. C. N., Zhong, D. P., and Barton, J. K. (2018) A compass at weak magnetic fields using thymine dimer repair. ACS Cent. Sci. 2018, DOI: 10.1021/acscentsci.8b00008

この記事は下記にも紹介されています。

P. J. Hore (2018) Sensitivity of DNA repair enzymes to weak magnetic fields may have relevance to the mechanism by which birds sense the Earth’s magnetic field. ACS Cent. Sci., DOI: 10.1021/acscentsci.8b00091

Hore さんといえば、NMR でも有名な先生ですが、ついでに下記も紹介しておきます。

NMR入門: 必須ツール 基礎の基礎 (Chemistry Primer Series) 
P.J. Hore (著),‎ 岩下 孝 (翻訳),‎ 大井 高 (翻訳),‎ 楠見 武徳 (翻訳)

DNA は紫外線を受けるとしばしば損傷します。その中でもよく知られている損傷がチミンダイマーです。隣り合うチミンどうしが結合して二量体になってしまうのです。チミンはピリミジン環をもつので、ピリミジンダイマーとも呼びます。

そこで、これを修復する酵素 photolyase(光回復酵素)が登場します。この photolyase は内部に FAD を持っています。これが完全に還元された形が FADH-(FADH-**)です。これに青色の光が当たると励起されて、チミンダイマーに電子を1個与え、その二量体を壊します。その際に (FADH*)側と、チミンダイマー(TT-*)側のそれぞれにラジカルができます。このラジカルペアですが、これが一重項状態(αβ-βα)になると緩和時間が伸び、さらに周りの磁場の向きによって DNA 修復の速度が変わるらしいのです。しかも、その磁場は地磁気ほど小さくても良いのだそうです。

詳しいことはよく分かりませんが、このラジカルペアは、内部では核スピンと hyperfine 相互作用を持ち、外部とは磁場との Zeeman 相互作用を持つため、singlet(αβ-βα)と triplet(αβ+βα, αα, ββ)の間で交換します。その最終的な割合が外部磁場との相対角度に依存するらしいのです。これが効率よく起こるためには、緩和時間が長くないといけませんし、また磁場も非常に強くないといけません。そこがまだあまり解明されていない問題点のようです。

実は cryptochrome は photolyase の先祖とされていますので、あながち急に photolyase が飛び出してきたわけではありません。Cryptochrome も FAD を持っていて磁場の向きに応じてラジカルペアを生成します。そこで、これが磁気コンパスではないかと言われています。

しかし、普通はこのような酵素は細胞内(核内)でブラウン運動により回転するため、磁場に対する向きもランダムに動いてしまいます。したがって、まだまだ解明されたとは言えない状態のようです。

渡り鳥だけでなく、鯨, Kujira、鮭, sake、鰻, MagRO、海老蟹 ロブスター、蝶々など、いろいろな生き物が長い距離を旅します。これらがどのようなコンパスを持っているのか、まだよく分かっていないようです。磁気、海水の香りなどさまざまな説があります。そして、もしかして人間も?と思ってしまいます。

ちょっと前までそれはまずあり得ないと思っていました。ところが、先日、とある遮蔽されていない超高磁場 NMR の下に潜って頭を動かすと、まるで車酔いしたような気分になりました。磁石の下から這い出すと、同じ姿勢でも全く問題ありません。他の数人もいっしょに何度試しても皆そのようになるので、もしかして何かある!と感じました。また、NMR 室に見学者を招待すると 100 人に1人ぐらいの割合で気分が悪くなる人が出てきます。毎年そのような事態になるので、いつも「閉所恐怖症ですか?」と尋ねるのですが、そうでもなく、その人達もたいへん不思議だと答えます。そういえば、目隠ししていても方角が分かる人がテレビで紹介されていました。どうなっているのでしょう?一応、血液の中にはヘモグロビンがあり、そのヘム鉄により強い磁場の中ではヘモグロビンは磁場に対して配向します。しかし、血流が乱す力の方が配向よりも圧倒的に大きいので、このまるで residual dipolar coupling, RDC を測る時の現象が、方向感知に効いているとは考えにくいでしょう。

ところで、上記のラジカルペアについてですが、これができる前は、この2つの電子はもともとは同じ核に所属しています。そのため、一方の電子スピンが上向き(α 状態)にあれば、他方の電子スピンは下向き(β 状態)にあります。ちょっとややこしいことに、一方が必ず α 状態にあるという意味ではなく、本当は α 状態と β 状態の両方の状態に同時にあります(α or β ではなく α and β)。これを量子力学の重ね合わせ状態と呼びます。そして、どちらの状態にあるのかを知るために観測すると、そのとたんにどちらかに収縮します。そして、もし β 状態に収縮して観測されたならば、相棒の電子スピンは即座に α 状態に収縮します。

興味深いことに、一つの電子が核を離れて別の核に移動し、ラジカルペアに変身しても、まだこの関係が保たれる場合があります。奇妙な量子もつれと呼ばれるそうです。もちろんそのようなコヒーレンスが保たれる時間が問題ですが、仮にそのようなもつれ状態がずっと続くとすると、なお不思議なことに、原理上は2つの電子がどれだけ離れていても(宇宙の両端に離して置いても)この関係が保たれるのだそうです。その場合、一方の電子スピンを観測して α 状態に収縮すると、遠く離れた電子スピンにも遠隔作用が及んで β 状態に収縮します。

しかし、ラジカルペアの一重項状態に三重項状態がある比率で混ざってくると、αβ 状態だけでなく αα や ββ 状態も混ざってきます。それらの比率がラジカルペアの向きと磁場の向きとの間の相対角度で決まるのだそうです。そして、渡り鳥がそれぞれの電子スピンの状態を観測(認識)することにより、一重項と三重項状態の間の比率が分かり、しいては磁場の向きが分かるという仕組みなのだそうです(ちょっと理解に自信がありませんが)。

どうも物理の話が濃すぎて、何が何だかよく分かりません。さらに最近は多世界解釈という思想?も入ってきました。これによると、αβ 状態と βα 状態という2つの世界があり、どちらかを観測したに過ぎないのだそうです。つまり、一方を観測した際にたまたま α 状態に収縮したので、その瞬間に他方は β 状態に収縮したという解釈ではなく、たまたま αβ 状態の世界の方を観測したに過ぎないという解釈です(あるいは観測した途端に世界が αβ と βα に分離した?)。どちらも嘘みたいな話ですが、個人的にはどちらかというと、この多世界解釈の方がしっくり来ます。

しかし、渡り鳥の目の中で本当にそのような事が起こっているのでしょうか?実は cryptochrome は植物も含めさまざまな生物が共通して持っており、実際に体内時計に関与することはよく知られています。よって、渡り鳥のような高等生物に進化する過程で生み出されてきたのではなく、はるか何億年も昔、生物の初期段階にすでにあったのではないかと言われています。

2018年1月10日水曜日

原始スープ

今の高校の生物の教科書をちらちらと見てみますと、最新情報が簡単ながらも載っており、これをしっかりと勉強しておけば、少なくとも大学の教養課程(いつの時代の話?)ぐらいは問題ないように思われます。そこで、ミラーの実験として有名な原始スープの箇所を見てみました。DNA の立体構造が解明された年 1953 年の有名な実験ですので、やはり今でも載っていました。また、生命は熱水噴出孔(数百度の!)で生まれたのではないかとも書かれています。

ところが、下記の本が上記をばっさりと否定しています。近ごろ読んだ中でかなり衝撃的だった本です。

ニック・レーン著、斉藤隆央 訳「生命、エネルギー、進化」(みすず書房)

一瞬「これは SF か?」と思ってしまうのですが、いろいろな科学的証拠も列挙されており、かなり尤もらしく思えます。教科書はその立場上かなり確実となった事しか書けないので仕方がないのですが、これまで試験必修と謳われていた箇所をびしばしと否定していく点はたいへんダイナミックです。教科書がどんどん書き換えられていくということは、その分野がどんどん進展しているという証拠でもあり、むしろ喜ばしいことです。

原始の地球では RNA が最初に生み出され、この RNA が遺伝子として複製されていったとする RNA ワールド説が一般的に有力です。RNA は触媒活性も持ちます。さらに遺伝情報をもコードし、後になってから現代のような DNA と蛋白質に、それぞれ遺伝と触媒機能という役割を分け与えていったとされています。この RNA が最初であるという点については、この本も賛成しているのですが、果たして原始の海が RNA やアミノ酸のスープになっていたのかどうか?このストーリにはエネルギーの流れが欠けているらしいです。ユーリー・ミラーの実験ではフラスコの中に太古の海をまねた原始スープがあり、その蒸気に稲妻をまねた放電が与えられました。しかし、計算によると、もっと超大量の稲妻が必要となるらしいのです。そこで、紫外線照射によりシアン化物などの有機分子ができたとする説も有力ですが、それでも生命を生み出すには薄過ぎるとのことです。

著者のニック・レーンは、全く別の環境で生命ができたと書いています。そこはアルカリ熱水噴出孔で、絶えず海水側から水素イオンが流れ込むような環境になっています。なぜならば、当時の海は弱酸性で、逆にアルカリ熱水噴出孔の中はアルカリ性だからです。酸性ということは、水素イオンが多いということです。この水素イオンの流れは、今のミトコンドリアでの呼吸や葉緑体での光合成(いずれもミッチェルの化学浸透共役が基本原理)と同じで、エネルギーを絶えず生み出し続けます。アルカリ熱水噴出孔では、止まることなく水素イオン、つまり化学浸透共役としてのエネルギー源が流入し続け、さらに原料となる物質も流れ込んで、逆に老廃物となる物質が流れ去っていきます。熱水噴出孔とは異なり、アルカリ熱水噴出孔の中はスポンジのような構造になっており、これがフィルターのような働きをして、ちょっと大きめの核酸やアミノ酸などが濃縮され、逆に小さめの低分子が流れ去ってしまうのでしょうか?

このような流入流出の環境ができて始めて物質が自己組織化し(一種の散逸構造)そこに細胞の原型が生まれて来るらしいです。原始スープには、このようなエネルギーの流れはおろか、基質の流入と老廃物の流出がなく、ほとんど平衡状態となっています。ここに生命体が自然発生してくることはないと説いています。なお、触媒として働いた物質は、鉄やニッケルの硫化物と推測されています。アルカリ熱水噴出孔は蛇紋岩と呼ばれる岩石でできており、鉄やマグネシウムなどの鉱物をたくさん含んでいるそうです。鉄硫黄(FeS)は、今でもフェレドキシンなど多くの蛋白質では活性中心を担っています。これら散逸構造と触媒などの条件全てが満たされる場所が、アルカリ熱水噴出孔であると主張されています。

日経サイエンス 2010 年 3 月号「深海底のロストシティーが語る生命の起源 Alexander S. Bradley」

アルカリ熱水噴出孔について書かれています。熱水噴出孔は数百度と熱過ぎるので、Google 画像検索すると、ハオリムシなどの生き物はちょっと離れたところにたむろしているのが分かります。しかし、アルカリ熱水噴出孔は内部でも 100 度未満と、生物が焼け死んでしまうような温度ではない点も重要です。