2018年7月12日木曜日

寒くても元気に

Hilser さんの論文がまた Nature に載りました。たいへん面白い内容です。

Saavedra, H.G., Wrabl, J.O., Anderson, J.A., Li, J., Hilser, V.J. (2018) Dynamic allostery can drive cold adaptation in enzymes. Nature. 558(7709), 324-328. doi: 10.1038/s41586-018-0183-2.

極限生物の中には高温と低温というお互いに逆の条件にそれぞれ適応して進化してきた生物がいます。化学反応の点でみると、普通は高温ほど反応速度が速くなりますので、高温に住んでいる菌ほど酵素反応が速くなりそうです。一般的に温度が 10℃ 上がるごとに反応速度が2倍になります(温度と速度は比例関係ではなくて「鰻登り」の指数関数の関係になります)。しかし、温泉に住んでいる菌も南極に住んでいる菌も酵素反応の速度はあまり変わらないはずです。もし住んでいる所の温度に従っていたら、温泉菌は超短命になっていたことでしょう。そこでどのように高温あるいは低温に適応したかですが、酵素の表面にある残基が変異したのに対して、基質が入るような重要な活性部位はあまり進化の上で変わっていないようです。活性部位は側鎖の微妙な位置関係によって成り立っており、進化上での try & error を通して作り上げられた精工品です。活性部位を触ってしまって活性がガタ落ちになった酵素はすぐに淘汰されてしまったのでしょう。すると、どうやって酵素の表面だけに起こった変異を遠く離れた中心の方の活性部位にまで影響させるのか(つまり、アロステリー)が問題になってきます。さもないと、表面は高温、低温に強いかもしれませんが、酵素反応はやはり高温で速く、低温で遅くといった状況になってしまいます。

著者らは大腸菌のアデニル酸キナーゼでこの謎を調べました。この酵素には3つのドメインがあります。LID-domain と AMP-結合 domain、そして両者に挟まれた CORE-domain です。当初は LID-domain と AMP-結合 domain の「基本的な立体構造」が進化の過程で変化して、回転数(turnorver:基質が入り生成物になって出て来る速度)を調整しているものと考えられていました。しかし、「基本的な立体構造」ではなく「ダイナミクス」が温度の変化を補償しているようです。

どうも LID-domain のフラフラ具合が酵素の基質に対する親和性を調整し、AMP-結合 domain のフラフラ具合が回転数を調整しているようです。ここで「やはり構造が変化しているではないか」と言われそうですが、あくまで「基底状態での構造 ground-state conformation」は変わっていません。ある瞬間にそれが励起状態の構造 excited-state conformation にパッと交換するのです。もちろん、その excited-state の構造は複数あり、その間でも行き来(交換)しているかもしれません。その意味ではこの構造交換もフラフラ具合と同じようなダイナミクスと考えてよいでしょう。

このような例は他の酵素でもしばしば見られます。基質が付いていない apo 状態では、2つのドメインが CORE ドメインに対してフラフラと動いています(open 状態)。基質が付くと、それらがひと塊になって rigid になります(closed 状態)。apo 状態のアデニル酸キナーゼの LID-domain も当初はこのひと塊のドメインとして「ドメインとしての構造を保ったまま」ヒンジを中心にして折れ曲がり向きが変化しているだけだと思われていました(rigid-body motion)。しかし、そうではなくて、どうも LID-domain だけがいわば局所的に unfolding するようです。

LID-domain は基質の結合部位を含んでいますので、このドメインが unfold すると基質との親和性が落ちます。そこで、Val を Gly に変異させました。Gly の方が自由に動けますので、unfold した状態でのエントロピー(位置のデタラメ度)が上がります。すなわち、自由度の高い unfold した状態に構造の平衡が移ります。実際に LID-domain が unfold した中間状態(I-state)のモル比が増えました。37℃ という室温では、野生体でこの I-state は 5% 程しか存在しませんが、Val→Gly 変異体では 40% ぐらいにモル比が増えました。そして、基質アナログとの親和性もやはり落ちました。一方、AMP-結合 domain の変異体については、基質の親和性に何らの影響も与えませんでした。

さらに NMR の CPMG 緩和分散法でも同じような結果が出ました。LID-domain は野生体でも apo 状態で構造交換しており、ほどけた構造(I-state)が 5% ほど存在するという結果です。LID-domain に変異がある場合は、このほどけた I-state のモル比が 40% ぐらいにまで増え、基質との親和性が落ちてしまいますが、温度を 10℃ ほど下げると野生体と同じようなモル比 5% にまで下がります。この仕組みを通して、住む場所の温度が変わっても Km 値がそれほど変わらないように進化の過程で変異しているようです。やはり、LID-domain は構造を保ったまま向きを変えるのではなく、unfold 状態になることによって基質との親和性を下げているようです。2004 年の Kern さんの論文(Nat. Struct. Mol. Biol. 11, 945)では、リガンドの結合に伴って LID-domain と AMP-結合 domain の両方が同時に扉を閉めて closed 構造になるようなイメージでした。由来する菌の種類が違うので、はっきりとした事は言えませんが、概念としては似ていると思います。しかし、異なる点は、それぞれのドメインが形を保ったまま動くのか、それとも unfold してしまうのかということです。

興味深いことに LID-domain の変異体は、活性(kcat)には影響を与えませんでした。kcat は基質が飽和状態にある時の反応速度、つまり全ての酵素分子に基質が付いている時の最大反応速度から見積もります。ですので、変異体が基質に対して低い親和性を持つようになったとしても(飽和するぐらい基質を大量に加えれば、全ての酵素が複合体になりますので)kcat の値は変わらないはずです。一方、AMP-結合 domain の変異体は野生体よりも活性が上がってしまいました。これは AMP-結合 domain がフレキシブルになることによって生成物を速く放出するためです。そして、これも温度を 10℃ ほど下げると野生体と同じような状態になりました。先程の繰り返しになりますが、この仕組みを通して、住む場所の温度が変わっても kcat 値がそれほど変わらないように進化の過程で変異しているようです。このことから LID-domain は親和性(Km)を、AMP-結合 domain は活性(kcat)を制御しており、両者はお互いに独立していることになります。しいては、kcat/Km 比もかなり似た値に保たれますので、基質で飽和していない時でも酵素の性能は温度につられてそれほど激変しない仕組みになっているのでしょう。別々の制御の方が相乗効果が生じますので、ちょっとの進化上の変異で、適応できる温度の幅を広げられるのかもしれません。

温度を変えながら反応速度を測定し、アイリングプロットというグラフを作ります。すると、活性化エンタルピーと活性化エントロピーの値を得ることができます。その結果、活性化エンタルピーは野生体と変異体とでほとんど同じでした。エンタルピー値は水素結合やファンデルワールス相互作用などさまざまな相互作用の変化を反映します(水素結合などを組むと熱が発生します。その熱は定圧条件下ではエンタルピーと同じになります)。したがって、遷移状態になる時の構造変化の度合いが変異の有る無しにかかわらず同じであることを意味しています。それに対して活性化エントロピーの方は、AMP-結合 domain の変異体が野生体よりも小さな値となりました。エントロピーは自由度の変化を反映します。生成物を放出するには AMP-結合 domain がフレキシブルになる必要があります。これがなかなか起こらないので、この AMP-結合 domain の柔軟性が酵素反応の律速となっています。しかし、AMP-結合 domain の変異体はすでに unfold 状態が多くなっているので(といっても動きが遅過ぎて CPMG では検出されていないようです)生成物の放出が容易になるのです。変異体ではすでに少し unfold しているため、完全に unfold した状態との自由度の差がそれほど大きくはありません。この差が自由度の差(つまりエントロピー差)ですので、AMP-結合 domain の変異体の活性化エントロピーは野生体よりも小さな値となるのです。

ここでちょっと不思議に思ったのですが、 LID-domain あるいは AMP-結合 domain がフレキシブルになった時に、それが酵素全体に与える影響が両者で逆になっています。例えば、高温になると AMP-結合 domain がよりフレキシブルになり、生成物の放出がより盛んになって活性が上がります。一方 LID-domain も高温でフレキシブルになりますが、今度は逆に基質への親和性を落とします。両者の影響がまるでお互いに相殺し合っているように見えます。ちょうど温度の変化を補償しているようです。シアノバクテリアの KaiA, KaiB, KaiC による体内時計にも温度補償性があるのですが、もしかすると、このように2箇所のダイナミクスの変化が蛋白質に与える影響がお互いに逆になるように組み合わせられているのかもしれません。

南極に住んでいるある魚類の乳酸脱水素酵素でも似たような特徴があるらしいです。その低温に適応した種の酵素を見ても活性部位の残基は変異しておらず、むしろ表面残基が Gly に変異しているそうです。低温にすると原子の動きが抑えられますので、一般的に fold した状態が安定化します(不安定な蛋白質の精製の時に冷やすのはそのためです)。しかし、この Gly への変異によってそのドメイン全体がフレキシブルになり、低温ではより rigid になってしまうことを相殺しているようです。この戦略により進化は大切な活性部位を危険を冒してまで変異させる必要はなく、活性部位から遠く離れたどこか表面の残基を Gly など小さく空間的にスカスカの残基に換えればよいわけです(ただし、その変異によってドメイン全体がフレキシブルになるような残基でないとだめですが)。要は、温度が変わっても動き(ダイナミクス)がおよそ同じ程度に落ち着くように、進化における変異が原子の充填具合を調整しているわけです。

また、著者らは最後に興味深いことを書いています。シャペロンはちゃんと fold しきれていないフレキシブルな領域を見つけてトラップします。今回のようにダイナミクスを変化させて酵素活性を調整しているような酵素では、温度が上がるとフレキシブルな箇所が増えてシャペロンに捕まってしまう確率が上がります。しかし、それによって細胞内全体でみると酵素活性が上がり過ぎるのを防いでいるのかもしれません。

2018年7月10日火曜日

共分散法 covariance

NMR スペクトルにおいて、共分散 covariance 法はこれまでのフーリエ変換 Fourier-transformation 法に代わるかもしれない プロセス法の一つとして注目を集めていました。最初は 2D 1H/1H NOESY, TOCSY などのように直接測定軸と間接測定軸が同じ種類のスペクトルにおいて、後者の分解能を前者にまで高める方法として提唱されました。その後、2つの異なるスペクトル(例えば (I, K) 相関スペクトルと (L, K) 相関スペクトル)の間で covariance をとることにより、(I, L) スペクトルを生成する方法として使われました。これは更に例えば主鎖帰属の HNCA と HNCOCA スペクトルなどにおいて 13Ca の化学シフトをもとに HN(i) と HN(i-1) を相関させるといった方法にも適用されました。

Harden, B.J., Frueh, D.P. (2018) Covariance NMR processing and analysis for protein assignment. Methods Mol. Biol. 1688, 353-373. doi: 10.1007/978-1-4939-7386-6_16.

Covariance の計算方法は実はたいへん簡単でして、上の例では (I, K) 行列と (K, L) 行列の内積をとるだけです。ここで後者の行列は転置しています。この共分散はフーリエ変換前の時間軸データでも、フーリエ変換後の周波数軸データでもどちらに適応しても構いません(細かな違いはありますが)。苦労する点といえば、4次元などのギガバイト大容量のデータに適用すると小さな PC が気の毒になる点ぐらいでしょうか?したがってプログラミングの FOR 文を使いまくるのではなく、できるだけ内積の高速演算ライブラリーなどを使ってコーディングした方が良いでしょう。

ただし、共分散法には false-positive な偽ピークが出てしまうという大きな欠点がありました。例えば、K 次元に沿ってちょっとだけずれた2つのピークがあったとします。目で見るとずれていることがすぐに分かるようなレベルでです。例えば、HNCA と HNCOCA とで 13Ca のピークが半値幅ぐらいずれていたとしましょう。この場合に、この2つのアミド基の帰属を相関させるような間違いは目視ではまず起こり得ません。ところが、共分散をとると、きっちりと相関を示す偽ピークとなってしまうのです。これでは使い物にならず、失望して止めてしまったものです。

ところが、最近はこれを克服する方法も出てきました。過去の論文にちらっと書いてあったことなのですが、共分散をとる前に微分をとっておくのです(もしかすると、分散波形でも良いのかもしれません)。すると、2つのピークが K 次元に沿ってぴったりと揃っている時に共分散が正の値を示し、逆に少しずれている場合には、共分散は小さな値、時には負の値を示します。これにより、false-positive な偽ピークを見分けることができます。

さらにエラーを減らす方法が提案されています。HNCA と HNCOCA とで K 次元に現れる 13Ca のピークをもとに HN(i) と HN(i-1) を相関させていったとします。しかし、この 13Ca だけだと間違いが多いでしょう。そこで普通は 13Cb, 13Co なども隣り合うアミド基を相関させるための共通の「糊」として使います。同じように (I', K') 相関スペクトルと (L', K') 相関スペクトルの間で covariance をとって (I', L') スペクトルを生成したとします。そして (I, L) も (I', L') も正の値のみを残しておいてから、両者を要素ごとに掛け合わせます。すると、いずれか一方に偽ピークがあった場合でも、掛け算によりそれは消えてしまいます。 (I, L) と (I', L') の両方に相関ピークがある場合にのみ、掛け算のスペクトルにピークが残るという仕組みです。ちょうど 13Ca, 13Cb, 13Co 全てを通して2つのアミド基どうしが相関を示した時に連鎖帰属を確定するのと同じです。二次元どうしですと、あまりメリットが感じられないかもしれませんが、3次元どうし((I, J, K) と (L, M, K))で K 次元に沿って共分散をとり4次元 (I, J, L, M) とすると、もしかすると有用かもしれません。もちろん今まで通りに処理すると多くの偽ピークが出てしまいます。しかし、covariance の前に K 次元に沿って微分をとり、covariance 後にスペクトルどうしを掛け合わせれば、上手く行くかもしれません。

Covariance や掛け算処理をする場合、各次元のデジタル分解能を合わしておくことは重要です。そのためには、同じマシンで同じスペクトル幅で一連のスペクトルを測っておきましょう。ポイント数は違っていてもスペクトル幅が同じであれば、0-fill 後のデータ数を同じ値にすることでデジタル分解能を調整することができます。異なるマシンで測った2つのスペクトルでは、いろいろなミスマッチが起こると考えられます。まず、マシンの絶対的な温度が異なります。さらにピークの位置も少しずれます。DSS のピークで 1H, 13C, 15N 次元を全て調整することでかなり揃えることができますが、それでも限界があります。本当は、HNCA と HNCOCA のペアなども interleaved-manner で測る方がよいのでしょう。それぞれを2日間ずつ連続して測定したとしても、それなりのずれは(ロックの不安定性などから)生じ得ます。

しかし、それでも false-positive な偽ピークが出てしまうそうです。これが起こるのはかなり線幅が異なるピークどうしで共分散をとった時です。例えば、HNCO では感度が高く大きな 13CO のピークが観えている一方、HN(CA)CO では感度が低く小さな 13CO のピークしか観えていないような時です。すると、共分散の前に微分をとったり、後に他の4次元と掛け算をしたとしても偽ピークが出勝ちです。そのような場合も想定して、一応は共分散をとる前のオリジナルスペクトルも少しチェックした方が良いとのこと(それでは covariance を活用する意味がないのですが)。また、4次元 (I, J, K, L) では (I, J) から (K, L) への相関と、その逆の (K, L) から (I, J) への相関の両方が共存しているかどうかを確かめることが重要とのことです。

ここで covariance の意味をあえて言うと、これまでの方法ではピークを拾い忘れていたり拾い方が悪ければ、それで終わりでした。拾った後の「化学シフトの値だけ」をもとに連鎖帰属をしていきますので、どのようにピークを拾うかが、その後の連鎖帰属の効率を決めているようなところがありました。一方 covariance 法では、false-positive が出る程に、そのような「拾い忘れ」が無いことが利点といえます。

いったい covariance という処理によって、スペクトルから何が失なわれてしまうのでしょうか?個人的にはピークトップの情報ではないかと考えています。人の目でピークを判断する時は、等高線で描かれた楕円の画像全体を観ながら、その中心をピークトップとして認識します。必ずしも最高強度の地点とは限りません。楕円が歪んでいたりすると、実はもうひとつ別のピークとオーバーラップしているのではないかと脳は推測したりもします。すると、その重なり具合に応じてピークトップの位置を少しずらしたりもします。初心者の場合、ここが欠点となってきます。covariance をとる前に微分するという処理は、ちょうどこのピークトップをできるだけ目立たせようとしていることに相当するのではないでしょうか?微分値ではちょうどピークトップの箇所で大きく正負が入れ替わります。そのため、どれぐらいの幅で微分(差分)をとるかも重要な要素になってくるだろうと考えられます。このような点が議論されているかとも思ったのですが、下記のオリジナル論文も含め見つかりませんでした。

Bradley J. Harden, Scott R. Nichols, and Dominique P. Frueh (2014) Facilitated assignment of large protein NMR signals with covariance sequential spectra using spectral derivatives. J. Am. Chem. Soc. 136 (38), 13106–13109. DOI: 10.1021/ja5058407.