2018年9月30日日曜日

コアセルベート化による過飽和

タウ蛋白質は微小管に結合してその安定性を調節している蛋白質ですが、同時に神経変性疾患であるアルツハイマー病の原因とも考えられています。悪さをするタウは重合してアミロイドを形成しています。そのようなタウは、微小管に結合して本来の機能を発揮することはもはやありません。今回の論文はどのようにしてアミロイドにまで育っていくのかの分子機構を NMR 解析も含めて調べたという内容です。

Ambadipudi, S., Biernat, J., Riedel, D., Mandelkow, E., & Zweckstetter, M. (2017) Liquid-liquid phase separation of the microtubule-binding repeats of the Alzheimer-related protein Tau. Nat Commun. 8 (1), 275. doi: 10.1038/s41467-017-00480-0.

ヒトの神経系では選択的スプライシングにより6つのタウのアイソフォームができます。ここで鍵となるのは、微小管に結合する部位でもある繰り返し配列の箇所です。この繰り返し配列だけになるように分解されると、これは全長のタウ(441 a.a.)よりもはるかにアミロイド化し易いのです。繰り返し配列のそれぞれは 31~32 アミノ酸から成りますが、これが3つの場合(3R-Tau)と4つの場合(4R-Tau)が知られています。ちなみに二番目の R が欠けた 3R-Tau は 4R-Tau よりも液滴を作る傾向が低いようです。

もともとタウはよく水に溶け、必ずしも凝集や沈殿を起こし易いというわけではないようです。ただし、ちゃんとした特定の立体構造はとっておらず、いわゆる天然変性蛋白質(IDP)です。これがどのようなきっかけで、そしてどのようにしてアミロイドにまで変化していくのでしょうか?その経路に液-液相分離があると、この論文は唱えています。FUS 蛋白質でも同じように、液-液相分離を経由して不溶性の凝集体になるのではと言われています。また、タウでもそうですが、負電荷をたくさん持った分子(例えば RNA など)と接触すると、このコアセルベーションが促進されて液滴になるようです。

この問題となる繰り返し配列は、疎水性残基をほとんど含んでおらず、とにかく Lys+ がたくさん含まれています。各リピート(31~32 a.a.)のうち Lys は5個ぐらいでしょうか?まず著者らはこの 4R-Tau がどれだけ液-液相分離を起こし易いかを 350 nm の濁度で3日後に調べました。なお、内部の Cys が酸化しないように常に還元剤を入れています。細胞内の環境が還元的であるためですが、もし何かの拍子で分子間ジスルフィド結合が起こると、さらに凝集が進むのかもしれません。まず、pH が等電点である 9.8 に近づくほど液-液相分離しやすいようです。濁度が本当に液-液相分離を反映しているのかを確かめるため、微分干渉顕微鏡で 15 μm ほどの液滴ができることも観ています。また、細胞内の crowd 効果に似せて PEG を加えると液-液相分離が促進されました。なお、アミロイドの特徴であるクロス β 構造ができているかどうかは、しばしばチオフラビン T の蛍光で調べられますが、この蛍光はありませんでした。よって、まだアミロイドは出来ていない段階だということになります。また、このタウ蛋白質は5℃といった低温では液-液相分離を見せず、42℃で液-液相分離を最も起こし易くなるようです。一方 65℃という高温では液-液相分離はできないことから、必ずしも温度による運動性の変化が液-液相分離のできやすさと関係しているとは言い切れません。FUS の場合はある温度(<~20℃)以下にすると液相分離を見せますが、これは FUS には Arg+ が多いのに対して、タウでは Lys+ が多かったり、リピートの N-末端側に P-Xn-G モチーフなどがあるためか?と書かれています。

やっと NMR の登場です。5℃での 2D 1H-15N HSQC スペクトルは典型的な単分散分子の IDP を示しています。ハムの壁(8.6 ppm)がきっちりと見えます。また、37℃ で液滴になってもスペクトルはそれほど変化していません。ここの解釈はかなり難しいところです。実は、CD の変化も観測されており、それによると温度を上げた時に「少しだけ」 β 構造が増えました。しかし、NMR スペクトルからは、新たに β-ストランド構造が増えたようにはとても見えません。もしかすると、液滴の中ではアミロイド構造への変化に向けて β-ストランドのような構造を一瞬はとるが、すぐに崩壊したり他の分子と不安定な超弱い水素結合を組み直したりの構造交換をフレキシブルに続けているような感じに見えます。著者らはさらに MTSL ラジカルをタウの Cys に付けています。まず5℃の単分散状態では、MTSL の周りだけが常磁性緩和しました。これは相互作用が分子内に留まっていることを示しています。一方、37℃ではほとんどのピークが広幅化しました。これは相互作用が分子間にも及んでいるためです。ただし、まだこの時点ではアミロイド化していませんので、相互作用は弱く遷移的で、動的に入れ替わっているでしょう。その様子が β 構造がわずかに増えたという CD の結果に反映されているのでしょう(あるいは、単分散でも液滴でもない、オリゴマーが生じているのかもしれません)。化学シフトが大きく違わないという点から、おそらくは液滴の内外で分子が交換し合っているという描像が当てはまるような気もします。この辺りの描像は次に書く予定の Ddx4 などと似ています(単分散と液滴の間を行き来する分子交換の現象が CPMG 実験で調べられています)。

他の例でもよく知られるように、タウ蛋白質もポリアニオン(多価の陰イオン)物質を加えると、アミロイド化に進みます。代表的なポリアニオン物質は RNA やグリコサミノグリカンであるヘパリンなどです。タウの液滴はポリアニオンが無いとそのままなのですが、これにヘパリンを 1/4 モル等量ほど加えると、もう5分後には重合を始め、2日後にはアミロイド線維になることが観察されています。ここで興味深いことは、液滴ができないような低温や高温では、たとえヘパリンを加えてもアミロイド線維にならなかったことです。しかし、必ずしも5℃でタウとヘパリンが相互作用しなくなるというわけではありません。NMR スペクトルによると、5℃でもちゃんと相互作用しているようです。ヘパリンによるタウの電荷の相殺は、ちょうど pH が pI に近づくのと似ています。この時に疎水性効果が浮き出て来るのでしょうか?しかし、塩濃度を上げると(静電的相互作用が弱まり、疎水性が強調されるはずですが)逆に液滴ができにくくなることから、やはり液-液相分離に至る物理的なメカニズムは複雑そうです。液-液相分離によってまずはタウ蛋白質が集まり、さらに電荷の相殺により、その局所濃度がさらに上がってアミロイド化するといったシナリオが考えられるでしょうか?予想通り 200mM の NaCl 存在下では液滴はできませんが、もちろんヘパリンを加えてもアミロイドはできませんでした。

MARK kinase はタウ蛋白質の Ser をリン酸化します。著者らは実際に 4R-Tau をリン酸化させました。すると、2 μM という低濃度であるにもかかわらず液滴を作りました。この濃度は実際に神経細胞の中のタウの濃度に匹敵します。さらに、この液滴はリン酸化されていないタウをも巻き込んでいくようです。

液滴内部の分子とその外側の単分散状態の分子との間の交換についてですが、この論文では NMR 信号の様子から速い交換と推測しています。この時の速い遅いは化学シフトの時間スケールに対してです。つまり、化学シフトが平均化してしまうほどに速いということで、だいたいマイクロ秒よりも速い場合を指します。一方、オリゴマーと単分散との間の交換もきっと起こっており、これは信号がかなり広幅化することから中間的な速さ(μs ~ ms)と思われます。オリゴマーでは分子間の相互作用がもう少し強いのかもしれません。

一般的に蛋白質の濃度をどんどん上げて行くと過飽和状態になります。ちょうど氷点下以下に冷やした水が何かの振動で急に氷に変わるように、過飽和状態の蛋白質も何か(別分子との接触など)により急に凝集を始めます。蛋白質の結晶ができる時もそうですが、アミロイドが出来ていく時もそうでしょう。タウ蛋白質が単分散している時には濃度は 2 μM 程度ですので、とても過飽和とは言えません。しかし、液滴の中では局所的に過飽和状態になっています。何も刺激がなければこれはこれで準安定状態ですが、ここに何かの刺激(温度変化、pH 変化、塩濃度の変化、ポリアニオンとの接触、リン酸化など)が入ると、急にアミロイドに変わるのかもしれません。

2018年9月25日火曜日

NOE と exchange を分ける in CEST

化学交換を NMR で検出する方法の一つとして relaxation disperson(緩和分散)法が有名ですが、最近は CEST 法(chemical exchange saturation transfer)もどんどん使われるようになってきました。緩和分散法は CPMG パルス系列を使うことからも分かるように、横磁化を対象とします。一方 CEST 法は縦磁化を扱いますので、Tex を 500ms など長い時間に設定することができ、緩和分散法よりも遅い交換(2〜20 ms のτex)を扱うことができます。また、緩和分散法では励起状態の化学シフト値を直接的には求めることができません。化学シフト値は、その励起状態での構造を推測するのに使えますので大変重要です。フィッティングで |Δω| を出した後、その符号を調べるための実験がまた別途必要です。一方 CEST では励起状態の化学シフト値が目に見えるような形で得ることができます。さらに CEST は 13C 均一標識の蛋白質でも可能なようです。緩和分散法では 1J(CC)-coupling は大きな問題ですので、芳香環の 13C の CPMG 実験では 12C-13C-12C のような標識法(alternate labelling)が必要になってきます。

最近は 15N, 13C だけでなく 1H の CEST も出てきました。ここで問題となってくるのは、プロファイルに現れた dip(オフセットを横軸にピーク強度を縦軸にとったプロファイルで、ピーク強度が落ちている箇所)が、果たして本当の構造交換によるものなのか?それとも NOE によるものなのかの区別です。これは高分子の NOESY における NOE 交差ピークが、交換によるピークと区別がつかないことと似ています。しかし、これには良い対策がすでに出ています。一つの 1H 核スピンを2つに分けて区別するのです。つまり、1H-15Nαと 1H-15Nβです。15N 核スピンの T1 が長く、Tex の間は α状態とβ状態が維持されるのであれば、この方法が使えます。構造交換では、1H-15Nαどうしで交換します。同じように1H-15Nβどうしでも交換します。まさか、基底状態の時は 15Nαであったのに、励起状態に移った時には 15Nβになってしまうということはないでしょう(15N T1 が十分に長ければ)。そこで基底状態の 1H/15N を 15N のそれぞれのスピン状態 α or βに応じて別々に測定します(spin-state selectively)。1H/15Nα の CEST における dip と1H/15Nβ の CEST における dip は別々のところ(ちょうど 1J だけ離れた位置)に現れるはずです。それに対して NOE の方は、近くの 1H が saturate されれば、双極子間相互作用を通して対象となる1H に NOE が移ります。その際、donor と acceptor の 1H に付いている 15N が α 状態であろうとβ状態であろうと全く関係ありません。よって、1H-15Nαも 1H-15Nβも同じ dip を持っているはずです。以上より、15N 核スピン状態に選択的に測定して得た CEST プロフィールをお互いに引き算すると、NOE からの寄与はキャンセルされ、本当に構造交換によって生じた dip のみが残ることになります。

Yuwen, T., and Kay, L.E. (2018) A new class of CEST experiment based on selecting different magnetization components at the start and end of the CEST relaxation element: an application to 1H CEST. J. Biomol. NMR. 70(2), 93-102. doi: 10.1007/s10858-017-0161-2.

この論文は更にそれを発展させたものです。15N スピン状態選択的に測定するのは面倒であるので、いっそのこと 2IzSz を測定してしまうという方法です。確かに、HzNa - HzNb = 2HzNz となります。それに伴うアーティファクトについて詳しく書かれています。一つは TROSY 効果により二つのダブレット HzNa, HzNb に強度差が起きることです。その強度差は新旧どちらの方法でも起こるのですが、上記のスピン状態選択法の場合、HzNa, HzNb それぞれで reference(saturation 無し)を測り、引き算をする前にこの reference により規格化してしまいます。そのため、TROSY 効果による強度差がキャンセルされます。それに対して新しい方法では、引き算を自動的にしてしまってから(つまり、2HzNz を検出してから)reference で規格化します。そのため、引き算による完全なキャンセルが出来なくなるのです。しかし、論文によると、それは大したアーティファクトにはならないとのことです。むしろ、two-spin order ではなく in-phase である 15Nz が検出に入ってくることの方が大きいそうです。一応、それを防ぐために 15N に 180 度パルスを偶数発打つ方法も紹介されています。これにより TROSY 効果(1H CSA/1H-15N DD)もキャンセルされ、15N in-phase もかなりキャンセルされます。ただし、Tex の実質的効果は半分になってしまいます。おそらくそこまでしなくても問題はないでしょう。

新旧の方法を比べると、特に 1H/13C HMQC-TROSY の場合は新しい two-spin order を検出する方が感度が高くなります。

2018年8月28日火曜日

大腸菌培養の最少培地 M9 その4

そろそろ終盤に差し掛かってきました。

(3) 安定同位体 (フィルターにて滅菌処理)

15NH4Cl(1.0 g/L と書かれている場合も多いのですが、価格もそれほど高くはありませんので、2.0 g/L 入れるのをお勧めします。)

[13C]-葡萄糖 2.0-4.0 g/L(15N のみ単一標識する場合は、普通の葡萄糖を 4.0 g/L 入れます。良かろうと思ってあまり多量に入れ過ぎると、異化代謝産物抑制(catabolite repression)という現象により発現がストップしてしまうことがあります。Glucose が多過ぎると cyclic-AMP が減ります。すると、cAMP が CAP 蛋白質から外れます。その結果、CAP が promotor から外れて RNA-polymerase をリクルートしなくなります。特にアラビノースオペロンを使っている時にはこれが顕著に起こります。

[2H, 13C]-葡萄糖 2.0 g/L(2H, 13Cでも標識する場合、もちろんこれも 3.0 g/L 入れた方がよいのは確かです。しかし、高くつきます。)

上記を混ぜ合わせて 0.22-0.45 μm フィルターを通して滅菌します。オートクレーブは厳禁です。なお、pre-culture 100 mL と main-culture 900 mL に分けて培養する場合、main-culture に 13C, 15N 安定同位体をすぐに入れてはいけません。pre-culture の育ち具合をみて、もし何かおかしいという場合にはここで実験をストップします。高価な安定同位体を1割しか無駄にせずに済みます。

培地に何かを入れ忘れている場合も多く、その場合 pre-culture と同じように main-culture でも「やっぱり」大腸菌が育たない場合が多いです。このような場合、main-culture をどうすればよいか迷うところですが、1つは、念の為ビタミンと金属類をもう一度いれてあげて、そこから 100 mL を抜き取って培養するのがよいでしょう。ビタミンや金属類は2倍量はいっていても問題ありません。それでも育たない場合は、塩溶液とビタミン核酸溶液を熱いうちに混ぜてしまったのかもしれません。

(4) 50mM CaCl2 2.0 mL

(5) グリセロール 1.0 g (15N のみで標識する場合)

(6) アンピシリン 50-100 ug/mL

(7) 微量金属(Trace-metal)

ZnCl2 20 μM (zinc-finger 蛋白質の場合)
   2 μM (zinc-finger 蛋白質でない場合)
CoCl2 0.4 μM
CuCl2 0.4 μM
NiCl2 0.4 μM
Na2MoO4 0.4 μM
Na2SeO3 0.4 μM
H3BO3 0.4 μM
EDTA 25 μM

論文によっては、これの 10 倍ほど濃い仕様も書かれているのですが、上記でおよそ足ります。金属蛋白質の場合は、その配位するはずの金属をもう少し加えてやらないといけないかもしれません。あまり多量に入れ過ぎるとかえって毒になってしまいます。また Se はちょっと手に入らないかもしれません。

少し探してみると、1000X ストック溶液が販売されているようでした(Sigma 92949)。これを重水に溶かした製品があればよいのですが(凍結乾燥するには面倒です)。

問題は重水培養する時です。その時のために、このストックは重水に溶かしておくとよいでしょう。

また、これら trace-metal の代わりに FeCl3 (35 mg/mL = 215.8 mM) を 500 µL ほど入れても構いません。その場合、最終濃度は 100 μM 程になります。この FeCl3 試薬の中にはちょっとの微量金属が含まれています。そのためあえて微量金属を入れなくても、このコンタミ分で足りてしまうというわけです。できるだけ安い粗雑な精製試薬を買いましょう。

(14) 下のようなビタミン原液(フィルターにて滅菌処理)を加えてもよいでしょう。5mL の水(重水)に下記の 10 倍量を溶かし、フィルター処理します。10 本のエッペンドルフに分注し冷凍しておきます。そのうち1本分を培地 1L に入れます。

葉酸 (ビタミンM) 1 mg
塩化コリン (ビタミンB) 1 mg
ニコチンアミド (ビタミンB) 1 mg
D-パントテン酸 (ビタミンB) 1 mg
ピリドキサール (ビタミンB6) 1 mg
リボフラビン (ビタミンB2, G)0.1 mg
イノシトール 2 mg

10 mg は耳かき半分ぐらいの量です。一つ一つを秤で測らなくても、適当に入れて 5mL の水(重水)で溶かすことで問題ないでしょう。もちろん、上記の 100 倍量を測り取り、50mL の水(重水)に溶かして 100 本に分注しても構いませんが。。。

2018年7月12日木曜日

寒くても元気に

Hilser さんの論文がまた Nature に載りました。たいへん面白い内容です。

Saavedra, H.G., Wrabl, J.O., Anderson, J.A., Li, J., Hilser, V.J. (2018) Dynamic allostery can drive cold adaptation in enzymes. Nature. 558(7709), 324-328. doi: 10.1038/s41586-018-0183-2.

極限生物の中には高温と低温というお互いに逆の条件にそれぞれ適応して進化してきた生物がいます。化学反応の点でみると、普通は高温ほど反応速度が速くなりますので、高温に住んでいる菌ほど酵素反応が速くなりそうです。一般的に温度が 10℃ 上がるごとに反応速度が2倍になります(温度と速度は比例関係ではなくて「鰻登り」の指数関数の関係になります)。しかし、温泉に住んでいる菌も南極に住んでいる菌も酵素反応の速度はあまり変わらないはずです。もし住んでいる所の温度に従っていたら、温泉菌は超短命になっていたことでしょう。そこでどのように高温あるいは低温に適応したかですが、酵素の表面にある残基が変異したのに対して、基質が入るような重要な活性部位はあまり進化の上で変わっていないようです。活性部位は側鎖の微妙な位置関係によって成り立っており、進化上での try & error を通して作り上げられた精工品です。活性部位を触ってしまって活性がガタ落ちになった酵素はすぐに淘汰されてしまったのでしょう。すると、どうやって酵素の表面だけに起こった変異を遠く離れた中心の方の活性部位にまで影響させるのか(つまり、アロステリー)が問題になってきます。さもないと、表面は高温、低温に強いかもしれませんが、酵素反応はやはり高温で速く、低温で遅くといった状況になってしまいます。

著者らは大腸菌のアデニル酸キナーゼでこの謎を調べました。この酵素には3つのドメインがあります。LID-domain と AMP-結合 domain、そして両者に挟まれた CORE-domain です。当初は LID-domain と AMP-結合 domain の「基本的な立体構造」が進化の過程で変化して、回転数(turnorver:基質が入り生成物になって出て来る速度)を調整しているものと考えられていました。しかし、「基本的な立体構造」ではなく「ダイナミクス」が温度の変化を補償しているようです。

どうも LID-domain のフラフラ具合が酵素の基質に対する親和性を調整し、AMP-結合 domain のフラフラ具合が回転数を調整しているようです。ここで「やはり構造が変化しているではないか」と言われそうですが、あくまで「基底状態での構造 ground-state conformation」は変わっていません。ある瞬間にそれが励起状態の構造 excited-state conformation にパッと交換するのです。もちろん、その excited-state の構造は複数あり、その間でも行き来(交換)しているかもしれません。その意味ではこの構造交換もフラフラ具合と同じようなダイナミクスと考えてよいでしょう。

このような例は他の酵素でもしばしば見られます。基質が付いていない apo 状態では、2つのドメインが CORE ドメインに対してフラフラと動いています(open 状態)。基質が付くと、それらがひと塊になって rigid になります(closed 状態)。apo 状態のアデニル酸キナーゼの LID-domain も当初はこのひと塊のドメインとして「ドメインとしての構造を保ったまま」ヒンジを中心にして折れ曲がり向きが変化しているだけだと思われていました(rigid-body motion)。しかし、そうではなくて、どうも LID-domain だけがいわば局所的に unfolding するようです。

LID-domain は基質の結合部位を含んでいますので、このドメインが unfold すると基質との親和性が落ちます。そこで、Val を Gly に変異させました。Gly の方が自由に動けますので、unfold した状態でのエントロピー(位置のデタラメ度)が上がります。すなわち、自由度の高い unfold した状態に構造の平衡が移ります。実際に LID-domain が unfold した中間状態(I-state)のモル比が増えました。37℃ という室温では、野生体でこの I-state は 5% 程しか存在しませんが、Val→Gly 変異体では 40% ぐらいにモル比が増えました。そして、基質アナログとの親和性もやはり落ちました。一方、AMP-結合 domain の変異体については、基質の親和性に何らの影響も与えませんでした。

さらに NMR の CPMG 緩和分散法でも同じような結果が出ました。LID-domain は野生体でも apo 状態で構造交換しており、ほどけた構造(I-state)が 5% ほど存在するという結果です。LID-domain に変異がある場合は、このほどけた I-state のモル比が 40% ぐらいにまで増え、基質との親和性が落ちてしまいますが、温度を 10℃ ほど下げると野生体と同じようなモル比 5% にまで下がります。この仕組みを通して、住む場所の温度が変わっても Km 値がそれほど変わらないように進化の過程で変異しているようです。やはり、LID-domain は構造を保ったまま向きを変えるのではなく、unfold 状態になることによって基質との親和性を下げているようです。2004 年の Kern さんの論文(Nat. Struct. Mol. Biol. 11, 945)では、リガンドの結合に伴って LID-domain と AMP-結合 domain の両方が同時に扉を閉めて closed 構造になるようなイメージでした。由来する菌の種類が違うので、はっきりとした事は言えませんが、概念としては似ていると思います。しかし、異なる点は、それぞれのドメインが形を保ったまま動くのか、それとも unfold してしまうのかということです。

興味深いことに LID-domain の変異体は、活性(kcat)には影響を与えませんでした。kcat は基質が飽和状態にある時の反応速度、つまり全ての酵素分子に基質が付いている時の最大反応速度から見積もります。ですので、変異体が基質に対して低い親和性を持つようになったとしても(飽和するぐらい基質を大量に加えれば、全ての酵素が複合体になりますので)kcat の値は変わらないはずです。一方、AMP-結合 domain の変異体は野生体よりも活性が上がってしまいました。これは AMP-結合 domain がフレキシブルになることによって生成物を速く放出するためです。そして、これも温度を 10℃ ほど下げると野生体と同じような状態になりました。先程の繰り返しになりますが、この仕組みを通して、住む場所の温度が変わっても kcat 値がそれほど変わらないように進化の過程で変異しているようです。このことから LID-domain は親和性(Km)を、AMP-結合 domain は活性(kcat)を制御しており、両者はお互いに独立していることになります。しいては、kcat/Km 比もかなり似た値に保たれますので、基質で飽和していない時でも酵素の性能は温度につられてそれほど激変しない仕組みになっているのでしょう。別々の制御の方が相乗効果が生じますので、ちょっとの進化上の変異で、適応できる温度の幅を広げられるのかもしれません。

温度を変えながら反応速度を測定し、アイリングプロットというグラフを作ります。すると、活性化エンタルピーと活性化エントロピーの値を得ることができます。その結果、活性化エンタルピーは野生体と変異体とでほとんど同じでした。エンタルピー値は水素結合やファンデルワールス相互作用などさまざまな相互作用の変化を反映します(水素結合などを組むと熱が発生します。その熱は定圧条件下ではエンタルピーと同じになります)。したがって、遷移状態になる時の構造変化の度合いが変異の有る無しにかかわらず同じであることを意味しています。それに対して活性化エントロピーの方は、AMP-結合 domain の変異体が野生体よりも小さな値となりました。エントロピーは自由度の変化を反映します。生成物を放出するには AMP-結合 domain がフレキシブルになる必要があります。これがなかなか起こらないので、この AMP-結合 domain の柔軟性が酵素反応の律速となっています。しかし、AMP-結合 domain の変異体はすでに unfold 状態が多くなっているので(といっても動きが遅過ぎて CPMG では検出されていないようです)生成物の放出が容易になるのです。変異体ではすでに少し unfold しているため、完全に unfold した状態との自由度の差がそれほど大きくはありません。この差が自由度の差(つまりエントロピー差)ですので、AMP-結合 domain の変異体の活性化エントロピーは野生体よりも小さな値となるのです。

ここでちょっと不思議に思ったのですが、 LID-domain あるいは AMP-結合 domain がフレキシブルになった時に、それが酵素全体に与える影響が両者で逆になっています。例えば、高温になると AMP-結合 domain がよりフレキシブルになり、生成物の放出がより盛んになって活性が上がります。一方 LID-domain も高温でフレキシブルになりますが、今度は逆に基質への親和性を落とします。両者の影響がまるでお互いに相殺し合っているように見えます。ちょうど温度の変化を補償しているようです。シアノバクテリアの KaiA, KaiB, KaiC による体内時計にも温度補償性があるのですが、もしかすると、このように2箇所のダイナミクスの変化が蛋白質に与える影響がお互いに逆になるように組み合わせられているのかもしれません。

南極に住んでいるある魚類の乳酸脱水素酵素でも似たような特徴があるらしいです。その低温に適応した種の酵素を見ても活性部位の残基は変異しておらず、むしろ表面残基が Gly に変異しているそうです。低温にすると原子の動きが抑えられますので、一般的に fold した状態が安定化します(不安定な蛋白質の精製の時に冷やすのはそのためです)。しかし、この Gly への変異によってそのドメイン全体がフレキシブルになり、低温ではより rigid になってしまうことを相殺しているようです。この戦略により進化は大切な活性部位を危険を冒してまで変異させる必要はなく、活性部位から遠く離れたどこか表面の残基を Gly など小さく空間的にスカスカの残基に換えればよいわけです(ただし、その変異によってドメイン全体がフレキシブルになるような残基でないとだめですが)。要は、温度が変わっても動き(ダイナミクス)がおよそ同じ程度に落ち着くように、進化における変異が原子の充填具合を調整しているわけです。

また、著者らは最後に興味深いことを書いています。シャペロンはちゃんと fold しきれていないフレキシブルな領域を見つけてトラップします。今回のようにダイナミクスを変化させて酵素活性を調整しているような酵素では、温度が上がるとフレキシブルな箇所が増えてシャペロンに捕まってしまう確率が上がります。しかし、それによって細胞内全体でみると酵素活性が上がり過ぎるのを防いでいるのかもしれません。

2018年7月10日火曜日

共分散法 covariance

NMR スペクトルにおいて、共分散 covariance 法はこれまでのフーリエ変換 Fourier-transformation 法に代わるかもしれない プロセス法の一つとして注目を集めていました。最初は 2D 1H/1H NOESY, TOCSY などのように直接測定軸と間接測定軸が同じ種類のスペクトルにおいて、後者の分解能を前者にまで高める方法として提唱されました。その後、2つの異なるスペクトル(例えば (I, K) 相関スペクトルと (L, K) 相関スペクトル)の間で covariance をとることにより、(I, L) スペクトルを生成する方法として使われました。これは更に例えば主鎖帰属の HNCA と HNCOCA スペクトルなどにおいて 13Ca の化学シフトをもとに HN(i) と HN(i-1) を相関させるといった方法にも適用されました。

Harden, B.J., Frueh, D.P. (2018) Covariance NMR processing and analysis for protein assignment. Methods Mol. Biol. 1688, 353-373. doi: 10.1007/978-1-4939-7386-6_16.

Covariance の計算方法は実はたいへん簡単でして、上の例では (I, K) 行列と (K, L) 行列の内積をとるだけです。ここで後者の行列は転置しています。この共分散はフーリエ変換前の時間軸データでも、フーリエ変換後の周波数軸データでもどちらに適応しても構いません(細かな違いはありますが)。苦労する点といえば、4次元などのギガバイト大容量のデータに適用すると小さな PC が気の毒になる点ぐらいでしょうか?したがってプログラミングの FOR 文を使いまくるのではなく、できるだけ内積の高速演算ライブラリーなどを使ってコーディングした方が良いでしょう。

ただし、共分散法には false-positive な偽ピークが出てしまうという大きな欠点がありました。例えば、K 次元に沿ってちょっとだけずれた2つのピークがあったとします。目で見るとずれていることがすぐに分かるようなレベルでです。例えば、HNCA と HNCOCA とで 13Ca のピークが半値幅ぐらいずれていたとしましょう。この場合に、この2つのアミド基の帰属を相関させるような間違いは目視ではまず起こり得ません。ところが、共分散をとると、きっちりと相関を示す偽ピークとなってしまうのです。これでは使い物にならず、失望して止めてしまったものです。

ところが、最近はこれを克服する方法も出てきました。過去の論文にちらっと書いてあったことなのですが、共分散をとる前に微分をとっておくのです(もしかすると、分散波形でも良いのかもしれません)。すると、2つのピークが K 次元に沿ってぴったりと揃っている時に共分散が正の値を示し、逆に少しずれている場合には、共分散は小さな値、時には負の値を示します。これにより、false-positive な偽ピークを見分けることができます。

さらにエラーを減らす方法が提案されています。HNCA と HNCOCA とで K 次元に現れる 13Ca のピークをもとに HN(i) と HN(i-1) を相関させていったとします。しかし、この 13Ca だけだと間違いが多いでしょう。そこで普通は 13Cb, 13Co なども隣り合うアミド基を相関させるための共通の「糊」として使います。同じように (I', K') 相関スペクトルと (L', K') 相関スペクトルの間で covariance をとって (I', L') スペクトルを生成したとします。そして (I, L) も (I', L') も正の値のみを残しておいてから、両者を要素ごとに掛け合わせます。すると、いずれか一方に偽ピークがあった場合でも、掛け算によりそれは消えてしまいます。 (I, L) と (I', L') の両方に相関ピークがある場合にのみ、掛け算のスペクトルにピークが残るという仕組みです。ちょうど 13Ca, 13Cb, 13Co 全てを通して2つのアミド基どうしが相関を示した時に連鎖帰属を確定するのと同じです。二次元どうしですと、あまりメリットが感じられないかもしれませんが、3次元どうし((I, J, K) と (L, M, K))で K 次元に沿って共分散をとり4次元 (I, J, L, M) とすると、もしかすると有用かもしれません。もちろん今まで通りに処理すると多くの偽ピークが出てしまいます。しかし、covariance の前に K 次元に沿って微分をとり、covariance 後にスペクトルどうしを掛け合わせれば、上手く行くかもしれません。

Covariance や掛け算処理をする場合、各次元のデジタル分解能を合わしておくことは重要です。そのためには、同じマシンで同じスペクトル幅で一連のスペクトルを測っておきましょう。ポイント数は違っていてもスペクトル幅が同じであれば、0-fill 後のデータ数を同じ値にすることでデジタル分解能を調整することができます。異なるマシンで測った2つのスペクトルでは、いろいろなミスマッチが起こると考えられます。まず、マシンの絶対的な温度が異なります。さらにピークの位置も少しずれます。DSS のピークで 1H, 13C, 15N 次元を全て調整することでかなり揃えることができますが、それでも限界があります。本当は、HNCA と HNCOCA のペアなども interleaved-manner で測る方がよいのでしょう。それぞれを2日間ずつ連続して測定したとしても、それなりのずれは(ロックの不安定性などから)生じ得ます。

しかし、それでも false-positive な偽ピークが出てしまうそうです。これが起こるのはかなり線幅が異なるピークどうしで共分散をとった時です。例えば、HNCO では感度が高く大きな 13CO のピークが観えている一方、HN(CA)CO では感度が低く小さな 13CO のピークしか観えていないような時です。すると、共分散の前に微分をとったり、後に他の4次元と掛け算をしたとしても偽ピークが出勝ちです。そのような場合も想定して、一応は共分散をとる前のオリジナルスペクトルも少しチェックした方が良いとのこと(それでは covariance を活用する意味がないのですが)。また、4次元 (I, J, K, L) では (I, J) から (K, L) への相関と、その逆の (K, L) から (I, J) への相関の両方が共存しているかどうかを確かめることが重要とのことです。

ここで covariance の意味をあえて言うと、これまでの方法ではピークを拾い忘れていたり拾い方が悪ければ、それで終わりでした。拾った後の「化学シフトの値だけ」をもとに連鎖帰属をしていきますので、どのようにピークを拾うかが、その後の連鎖帰属の効率を決めているようなところがありました。一方 covariance 法では、false-positive が出る程に、そのような「拾い忘れ」が無いことが利点といえます。

いったい covariance という処理によって、スペクトルから何が失なわれてしまうのでしょうか?個人的にはピークトップの情報ではないかと考えています。人の目でピークを判断する時は、等高線で描かれた楕円の画像全体を観ながら、その中心をピークトップとして認識します。必ずしも最高強度の地点とは限りません。楕円が歪んでいたりすると、実はもうひとつ別のピークとオーバーラップしているのではないかと脳は推測したりもします。すると、その重なり具合に応じてピークトップの位置を少しずらしたりもします。初心者の場合、ここが欠点となってきます。covariance をとる前に微分するという処理は、ちょうどこのピークトップをできるだけ目立たせようとしていることに相当するのではないでしょうか?微分値ではちょうどピークトップの箇所で大きく正負が入れ替わります。そのため、どれぐらいの幅で微分(差分)をとるかも重要な要素になってくるだろうと考えられます。このような点が議論されているかとも思ったのですが、下記のオリジナル論文も含め見つかりませんでした。

Bradley J. Harden, Scott R. Nichols, and Dominique P. Frueh (2014) Facilitated assignment of large protein NMR signals with covariance sequential spectra using spectral derivatives. J. Am. Chem. Soc. 136 (38), 13106–13109. DOI: 10.1021/ja5058407.

2018年6月24日日曜日

生きた博物館

過去に何かの記事で NMRBox を紹介しましたが、また改めて。

これは NIH からのサポートを受けている一種のクラウドシステムです。サーバにはいろいろな NMR に関するソフトがインストールされています。たいへん興味深いことは、もう古くなって使えなくなってしまったようなソフトもそこでは生(活)きていることです。もちろん今でも優秀なソフトはどんどん開発されてはいますが、どうしても新しいトピックスをテーマとしたソフトとなってしまっており、いわゆる古典的な機能をもったソフトが、気が付いたら消滅してしまっているということがよくあります。しかし、この NMRBox ではそのようなソフトが使えるのです。まるで博物館です。

また、non-uniform sampling で測定した4次元データなどは、プロセスするのも大変です。そもそも私のところも Windows-XP の古い PC などを Cent-OS linux などに使い回しているものですから、四次元 NUS をプロセスするとなると今でも大変です。さらに PC も古くなってくると、突如として壊れます。もうこの半年で3台が去ってしまいました。なんとかデータだけは Puppy を使って幸運にも救出できてはいるのですが。一方、NMRBox には NMRPipe の IST や Smile がありますし、メモリーも H/D も豊富に備えていますので、そのような資源について心配する必要はありません。つい先日まで四次元 NUS の Smile によるプロセスが自分の PC ではメモリー不足でうまく行かなかったのですが、やっと NMRBox でうまくいきました。

また、夜帰宅してからでも週末でもプロセスの続きを見たり、ピークを帰属することができます。実際にプロセスしているコンピュータはきっと NIH にあるわけで、そのディスプレーを Real VNC viewer を使って見ていることになります。家でも職場でも出張中でも講演中でも NMRBox にアクセスできるということは素晴らしいことです。

ちょっと変わった使い方ですが、環境のセットアップをうまく出来ない人がいた時に、こちらで NMRBox にログインして環境を整えてあげることができます。例えば、連鎖帰属に必要な全ての3次元4次元スペクトルをまず関連付けます。二次元 HSQC のピークをクリックすると、自動的に3次元4次元の対応するピークに飛んでいくように設定しておきます。その後でその人がログインすれば、もうすでに帰属のための環境は整っていますので、後は実際の帰属作業に集中してもらうことができます。これまでは、わざわざその人の PC のところに行って環境を整えていましたので、それが出来る時間が何かと限られてしまっていました。4次元を何個もセットアップしようとすると何日も通わないといけませんでした。しかし、今は自宅からセットアップできます。また、担当者が代わっても、次の人は環境をそのまま引き継ぐことができます。面白いことに2箇所から同時にログインすると、他者の作業の状況をリアルタイムで見ることができます。まあ、同時に同じピークをピックしないように気を付けないといけませんが。。。。ちょうど OneDrive や GoogleDrive を他人と共有しながら、一つの Word ファイルを同時に編集しているような感じになります。

惜しい点は、どうしても画面を日米間で転送するので、ちょうど国際電話をかけている程度の時差が生じてしまう点です。1秒以内なのですが。vi でテキストファイルを編集していると、どうもカーソルが1秒ほど遅れて着いて来るため、希望する行を行き過ぎることが多いです。まあこの辺りは仕方がないですね。

できれば、Cyana, MagRO, Topspin も入っていれば言うこと無しなのですが。Topspin はどうしても立ち上がらず、管理者に問い合わせたら、ちょっとしたミスマッチでもう少し待って欲しいとのことでした。期待したいと思います。Bruker さん、どうかよろしくお願いいたします。

1時間程前にスタートさせた四次元 NUS のプロセスが順調に進んでいるようです。それでは明朝の結果に期待して、そろそろお休みしたいと思います。もちろん私の PC の電源は切ってもプロセスは続きます。zzzZZZZ

2018年5月26日土曜日

今だに位相補正で苦しむ

何でもない NMR 実験のはずが、そのプロセスで意外にも時間を費やしてしまいましたので、その覚え書きとして残しておきます。その測定とは HCCH-COSY です。ちょっと高分子量の蛋白質になってくると、CCONH や HCCONH での側鎖のピークが急に観えなくなります。そこで、HCCH-COSY などアミド水素にまで磁化を移動させない方法で側鎖の帰属を試みました。

三次元の HCCH-COSY と言っても、FID としての直接測定軸(x)を除いた y, z 軸がどれに当たるのかが問題です。今回は HCcH-COSY と hCCH-COSY をとってみました。小文字の箇所が検出をスキップする核種を示しています。4次元に拡張すると間接測定次元をどの 1H, 13C に当てるかという問題はなくなるのですが、やはりそれなりに感度が必要になってきます(次元が一つ増えるごとに感度がルート2に反比例して落ちる)。

ところが、Br 社のパルスプログラムでは、どの HCCH-COSY が上記の各々に当たるのかをすぐには見つけられません。パルス図を見て初めて、そうか HCcH-COSY が hcchcogp3d で hCCH-COSY が hcchcogp3d2 だとやっと分かります。プログラムの後ろの「2」は、新旧のバージョン番号を示しているのだと思っていましたが、そうではありませんでした。

日本では地震が多いため、最近は皆? NUS で測定します(たとえ 100% sampling であったとしても)。地震で変になった箇所のデータを後から除けるためです。それに私は窒素やヘリウムを入れるスケジュールをすぐに忘れて測定をスタートしてしまうので、三次元測定の最中にやむなく測定を止めないといけない事もしばしばです。そのような時に NUS で測定していると、一応は途中までのデータを捨てずに有効活用することができます(もちろん感度は落ちますが)。また、重水素デカップリングをかけた実験の場合には、NUS にしないと autoshim との干渉が起きてしまい、翌朝にはロック信号が底辺をごそごそと蠢いているという事態を見ることになります。

さて測定が終わり、まずは hCCH-COSY (hcchcogp3d2) をプロセスすることにしました。ここで困ったことはパルスプログラムには aqseq 312 と書かれていることです。これは F3, F1, F2 の順にサンプリングすることを意味します。In0=Inf1/2 という表現から F1 には D0 インクリメントが対応しており、in10=inf2/2 という記述から F2 には D10 インクリメントが対応していることが分かります。FID での検出(F3)を Hi とすると、D0 が 13Cj に D10 が 13Ci に対応することもパルスプログラムで調べておきます。さて aqseq 312 ですので、NMRPipe の fid.com では y と z のカラムがひっくり返るはずなのです(と思い込んでいました)。しかし、実は NUS の場合にはきっとこれが起こらないのです。というのは、NUS では y と z のどちらを先にインクリメントするのかという概念がそもそも無くなるためです。それに nuslist でも y と z のインデックス番号のカラムをひっくり返してはいませんでした。しかし、それに気付かずに fid.com での y と z カラムをわざわざ交換してしまいました。普通でしたら間違いにすぐ気付くはずなのですが、この時は y, z ともに 13C 軸なので違いがすぐには分からないのです。

こうして、Hi を横軸に Cj を縦軸に二次元として表示すると、スライス軸は Ci になります。するとピークが Cj 次元軸に平行に点々と縦に並ぶはずです。実際には感度が悪くて並ばなかったので、ますます気付けなかったのですが。中には何故 Hi と Ci を二次元表示しないのかと不思議に思われる方もおられるかもしれません。感覚的にはその方が分かり易いかもしれません。4次元ではどの軸を後ろに持っていくかはさらに興味深い問題です。理屈よりも実際に試してみてその時の良し悪しを実感してみた方が面白いでしょう。将来は目の前の空間に球が浮かんだような感じの表示(ホログラム)になるので、今のような議論は消えるでしょう。ホログラムで四次元はどう表示するのかは問題ですが。

次に HCcH-COSY (hcchcogp3d) のプロセスです。これは更に悲惨でした。F1 が 1Hj に F2 が 13Cj と異なる核種に対応しているので、両軸をひっくり返してしまうという間違いはないのですが、F1 軸は TPPI-States に加えてちょっと特殊な位相回しが入っていました。パルスプログラムの下の方に calph(ph3, -90) という記述があります。これは D0 をインクリメントした時に ph3 を 90 度逆に回すことを意味します。せっかく TPPI-State で x から y に +90 度進めたのに何故また逆転させるのか?これは一種の TPPI 法に似た概念を利用していまして、TPPI-States を基本としながらも、さらに t1 インクリメントごとに観測座標を 1/4 回転だけ逆に回すのです。すると、磁化ベクトルがスペクトル幅の 1/4 だけ遅く回っているように見えるのです。これを FT する際にはスペクトルの中心をスペクトル幅の 1/4 だけあえて高磁場側に移します。HCCH-COSY ではアミド水素は観えませんので、4.7ppm から低磁場側はほとんど必要なくなるのです。その代わり環電流シフトを受けたメチル基なども検出するために高磁場側までスペクトル幅を広げる必要があります(ピークを折り返してやってもよいのですが、ややこしくなりますので)。

普通はこのような場合、周波数シフト fq を施して 4.7 から 3.0 ppm ぐらいに中心周波数を移せばよいのですが、何故 Br 社はあえてこのような奇妙な方法をとっているのでしょう?しかし、まあここまではよくあるパターンでした。ところが hcchcogp3d をよく見ると、d0=inf1/4 と書かれています。Br 社にしてはめずらしい。これは t1 の初期値を t1/2 に設定することによって、折り返しのピークを負に逆転させる方法です。昔はこれしか使わなかったのですが、もう最近はスペクトル幅を広くとって折り返しをあまり利用しないようになってきました。それで NMRPipe の位相を ph0=-90, ph1=180 に設定しました。Topspin では 90, -180 なので、これも記憶がごちゃごちゃになってしまう要因です。さらに echo-antiecho のプログラムによっては ph0=0 もあり得ます(足し算と引き算の結果のどちらを虚数側に選ぶかで変わってくる)。

ところがスペクトルを見てみると、かなり位相がずれているのです。そもそも NUS データに普通の FT を施して位相だけを観ようとするのですから悲惨です。めちゃめちゃな位相のピークが羅列しているのです。しかも軽水溶媒で測定したので、水のベースラインのうねりもかぶってきて、もうまるでゴミが一杯浮かんだ昔の荒れた大阪湾のような情景です。HCCH-COSY も普通の COSY のようにピークが桜模様になるんだっけ?と思いながら(そんなことはありません)ph0 = 0, 90, ph1=180, -180 さらに F2 の方が狂っているのかもと F2 も同様に変えると、その組み合わせだけで 16 通りです。この間違いに気付くには一晩を要したのですが、実はスペクトル中心を 1/4 だけずらしているので、ph0 も 1/4 だけずらさないといけなかったのです。何の 1/4 か?もちろん ph1=180 の 1/4 です。したがって、ph0= 90+180/4=135, ph1=180 が正しかったのです。NUS でなければ、マニュアルで位相補正した際に何気なく気付くのかもしれませんが、NUS データでは FT 後のデータは錯乱状態ですので、その中でかろうじてピークの姿を醸し出しているのを選んで位相調整することになります。もう二度目の間違いはごめんですので、ここに覚え書きしておいて次は参照することにします。

ところで4次元の NUS のプロセスについてですが、自分の PC で行うと2日経っても終わらず、さらに Word すらも重い状況になってしまいました。しかし、NMRBox を活用してから、その問題が一挙に解決しました。NMRBox は一種のクラウドで、無料で過去のさまざまな NMR ソフトを活用できます。先日もちょっと質問を送ったところ、翌日には回答が返ってきました。もう本当に「ありがとう!」です。おかげで4次元に躊躇しなくなりました。