毎日エネマル: 11月 2024

以前にもご紹介したことがあるかもしれません。今回は（熱力学の議論も入り）ちょっと難しい内容で、きっちりとは理解できませんでした。「一応、こうかな？」と自分なりに理解したところを書いてみましたが、間違えているかもしれません。

J.O. Streit, J. Christodoulou (2024) The ribosome lowers the entropic penalty of protein folding. Nature 633(8028): 232-239. doi: 10.1038/s41586-024-07784-4.
PMID: 39112704

普通の水溶液中での単離された蛋白質と比べて、リボゾームから出てきたばかりの（まだリボゾームにつながっている状態での）新生鎖は、以下の点で異なる。

リボゾームの出口から出てきた新生鎖は、比較的のびた構造をとる。そのため広い表面積 SASA が水和し、水和のエントロピーの点からは unfold 状態が不安定になる *1。さらに、揺らぎが制限され、とりうる構造の種類も少なくなるため、新生鎖の構造エントロピーの点でも unfold 状態が不安定になる *2。この構造の制限のために球状の構造をとりにくくなり *3、さらに、リボゾーム表面の負電荷の影響により、エンタルピーの点で fold 状態も不安定になる *4。よって、フリーの蛋白質に比べて |-TΔS| も |ΔH| もともに小さくなる *5。この特徴は配列にあまり依存せず、新生鎖はリボゾームの上では fold 状態も unfold 状態も（フリーに比べて）不安定といえる。この影響はリボゾームから離れるほど弱くなる *6。In vitro では不安定性を起こしてちゃんと fold しないような変異体においても、リボゾームの上ではその unfold 状態も fold 状態も不安定になり、wt と似た folding 中間体を経て、無事に fold される率が上がる（緩衝効果）。

（*番号の注釈）

*1 水は束縛されずに自由に泳ぎ回る方を好む。しかし、unfold した蛋白質では表面積が広がり、より多くの水が表面に水和し束縛されるので（水和エントロピーの低下）、水の立場にたつとこれは嫌なことである。シミュレーションによると、新生鎖はフリーな unfold 蛋白質より大きな SASA（水が接触できる表面積）をもつそうである（誇張すると、リボゾーム上では伸びきっている）。また、水と蛋白質表面が相互作用すると、その間で水素結合が形成されるため、水和のエンタルピーという点でみると、SASA が大きくなることは unfold にとって好ましいといえる。しかし、著者らによると、その寄与は小さい（エントロピー低下に負けてしまう）とのことである。

リボゾームについた状態では folding の熱容量 ΔCp が大きい。ちょっと難しいが、これは unfold 状態で SASA が増えることを意味している。Fold 状態では内部に隠されていた疎水的なアミノ酸が、unfold 状態では表面に露出する。これが ΔCp が大きくなる原因らしい。ただし、ΔCp の温度に対する変化は小さい。

*2 Unfold した蛋白質はその中の原子が自由に動き回れるので、蛋白質の構造エントロピーの点では unfold 状態は好ましい。しかし、リボゾームから出てきたばかりの時は、C 末端側が巨大なリボゾームに掴まれ自由な運動が制限されてしまうため、蛋白質はこの延びたままの unfold 状態を嫌う。

*3 新生鎖は大きなリボゾームにつながっているため、それが邪魔をして丸いコンパクトな構造を取りにくくなると考えられる（立体排除）。すると、本来の fold 状態でとるべき水素結合、静電的相互作用、疎水的相互作用（ファンデルワールス相互作用）がとれないので、エンタルピーの点で好ましくない（エンタルピーの絶対値の低下）。

*4 リボゾーム表面の負電荷の影響により、リボゾームにつながったままの新生鎖の中では、本来 fold 状態でとられるべき静電的相互作用がうまく働かないのだろう。

*5 フリーな蛋白質では |-TΔS| も |ΔH| もともに大きい。しかし、fold 状態と unfold 状態のどちらの分子数が多くなるかは、両者の差 ΔG = ΔH - TΔS で決まり、その差はお互いにかなりがキャンセルしあって、ごく僅かとなる。これを marginal stability とよぶ。もし ΔG が０ならば、fold/unfold は 50:50 である。

新生鎖では、 |-TΔS| も |ΔH| もともに小さくなってしまうが、ΔG が最終的にどうなるかについては明記されていない。いずれにしても、フリーな蛋白質とは異なるエントロピー、エンタルピーの大きさ（絶対値）となるため、フリーな蛋白質ではとらないような folding 中間体の構造をとることがある。この中間体は活性のある酵素にちゃんと fold するために重要な場合がある。例えば HRAS では 1H/15N-HSQC がほとんど同じに観えても、in vitro で refold させた場合は活性がない。おそらく、in vitro の refolding では、途中で inactive な構造にトラップされてしまうのだろう。しかし、ちゃんとリボゾームから出てきた場合にはもちろん活性を維持していることから、active な構造に向かう際の folding の道筋が、リボゾームにつながっている時とそれから離れている時とでは異なっているのかもしれない。

*6 とはいえ、かなり遠くでも効いていることから、新生鎖とリボゾーム表面の負電荷との直接的な相互作用はあってもその寄与は小さい。実際、負電荷だらけの poly-Glu で試しても、WT と大差はなかった。よって、この特徴は配列にあまり依存しない。

（補足）

エンタルピー：水素結合、静電的相互作用、疎水的相互作用（その中のファンデルワールス相互作用）など、お互いに引き合う作用が増えるほど、エンタルピーはより負になり（絶対値が大きくなる）、その状態が安定化してその分子数が増える。これらの相互作用が形成されると熱が放出される。この発熱がエンタルピーに相当すると考えてもよい（熱が外へ逃げていってしまうので負の値になる）。しかし、これがいえるのは定圧条件下だけである。しかし、蛋白質を高圧や低圧の中で実験する例は（高圧 NMR 実験のように）かなり特殊であろう。

エントロピー：原子や分子が自由に動け回れるほど大きくなり、そして好ましくなり、その分子数が増える。つまり、制限や束縛は嫌ということ。蛋白質の fold/unfold を考える時、蛋白質分子の中の原子だけを考えていたらだめ。蛋白質は真空にあるのでなく水中にあるので、水分子の水和エントロピーも考えなくてはならない。これが、疎水的相互作用（その中の水和部分）に相当する。よって、疎水的相互作用と一言にいっても、ファンデルワールス相互作用（エンタルピー的寄与）と水和（エントロピー的寄与）の二つに分けられる。

餃子の漬け汁では、お酢の中にラー油を入れる。すると、いくら箸でかきまぜても１分もするとラー油がお皿の真ん中あたりに寄り集まってしまう。水分子はラー油の周りにトラップされ動けなくなる。これは水にとって大変嫌なことである。よって、水はそこから解放されたい。少しでも水を解放するには、ラー油の集まりができるだけ一つになればよい。集まるほど、表面積の合計が少なくなるのは感覚的につかめるだろうか？

1 cm 辺のサイコロが２個あるとする。その二つの表面積の合計は 12 である。ところが、その二つのサイコロを接触させてしまうと、その直方体の表面積は 10 になるのかな？

話を元に戻そう。よって、水とラー油が反発しあうわけではなく、あくまで自然のなりゆきで気がついたら（水に嫌われた）ラー油が集まってしまう。これが水和エントロピーの効果。ところが、ラー油は集まってみると、お互いラー油どうしで引き合うことに気がつく。そして、がっちりと手を結んでさらに固まってしまう。ファンデルワールス相互作用と呼ぶが、これがラー油のエンタルピー効果。

もうひとつ例を。南極では寒い北風ブリザードが吹くので、ペンギンの子供達は自然に集まってくる。これはペンギンのエントロピー効果。ところが集まってみると、お互い羽がないと思っていたのに手もあることに気づき、手を結びあって団子になり寒さに耐える。これがペンギンのエンタルピー効果。

蛋白質の folding も餃子やペンギン？と同じ原理で進む。

自由エネルギー：ΔG = ΔH - TΔS で表される。厄介なのはマイナス符号である。ΔS というとエントロピーどうしの差であり（論文では S(fold) - S(unfold)）、ΔS が増えるほど fold 状態のモル数が増える。しかし、-TΔS と実際にはマイナスの数値として自由エネルギーに寄与するため、自由エネルギーの点ではこれが下がるほど fold 状態が安定になる（論文では unfold 状態が不安定化する）。よって「エントロピー値 S が増減する」と「エントロピー的寄与 -TΔS が増減する」は真逆の状況を指すため、注意が必要である。おそらく「エントロピー的に fold 状態が安定（unfold 状態が不安定）になる」という表現の方が無難と思われる。

エントロピー S は必ず正の数となる。しかし、ΔS は S どうしの差であるため（例えば、論文では fold 状態の S から unfold 状態の S を引き算した値）正負両方の数をとり得る。そこに -T が掛け算されるので、ますます誤解を招きやすい。さらに、S(unfold) - S(fold) で表現する文献もあるので、初心者はさらに混乱する。

なお上記の発熱（エンタルピー）によって、水を含む周りの環境が熱せられ、その結果、水分子の運動性が上がる。これによって、周り（水環境の）エントロピーが上がるわけだが、このような環境のエントロピーも考慮できれば、（蛋白質の）自由エネルギーの代わりに（蛋白質と水の）エントロピーだけで、安定性を議論することができる。エントロピー増大の法則はこのようなケースに使える。

例えば、細胞の中では核やミトコンドリアなど見事な秩序が保たれている。これはこの細胞内オルガネラのエントロピーが下がることを意味する。ここで、自然界はエントロピー増大に向かうはずなのにおかしいなどと思ってはいけない。実は、この秩序を形成する際に熱が出て、細胞質の水分子の運動を激しくしてしまっているのである。このため、水のエントロピーは上がってしまう。では、二つのエントロピーを足し算するとどうなるのか？必ず正の数になる。これがエントロピー増大の法則。この両者の和がもし０になったら、それは永久の命を得たことを意味する（熱力学の教科書では永久機関と称されるが、これを作れたら、ノーベル賞をいっきに百個ほどもらえる）。

熱力学は難しくて、理科の中ではあまり人気がない。しかし、圧力一定という条件を付せば、かなり感覚にマッチしてくる。エントロピー増大は自由が増大（低下は束縛）、エンタルピー低下は熱が逃げる（増大は熱を得る）と覚えれば、学問的には正解とはいいがたいが、まあ使える。

ソフトウェア ANSURR

https://ansurr.com/

N.J. Fowler, A. Sljoka, and M.P. Williamson (2021) The accuracy of NMR protein structures in the Protein Data Bank. Structure 29 (12) 1430-1439.e2.

この ANSURR というソフトウェアに関する論文を読んでみた結果、NMR 構造の「正確さ」（精密さではありません）を見積もる手段として、非常に有用であるように思われます。これまで NMR 構造の正確性を評価する指標はあまり存在していませんでした（構造計算に使わない RDC などは良いデータでしょう）。そのような状況において、Ramachandran 解析は geometry を評価する上で最適な手法の一つと考えられます。一方で、例えば 20 個の NMR 構造を計算して得られる重ね合わせ時の rmsd 値は、精密さを示す指標としては適切ですが、正確さを示すものではありません（例えば、20 個全てが同じ間違えた構造に収束していたような場合、rmsd は良い値になりますが、それらは不正確です）。特に、主鎖の重ね合わせが良好な結果を示していても、側鎖がばらついていたり、水素結合が誤っていることも多々あり、これらの問題がその後のドッキングやダイナミクス解析に悪影響を与えている可能性があります。また、距離制限の残基あたりの数も、正確性を評価する上でそれほど良い指標とは言えません。これは、NOE を距離制限に変換する際に user-defined な方法が介入するためであると考えられます（ノイズとピークの判断は主観的ですし、また、大きな NOE は 3 Å程度などと主観的に距離を制限している場合が多い）。

この ANSURR 法の中核は、主鎖の化学シフト値を用いて主鎖の局所的剛性を計算する点にあります。この計算は、ランダムコイル指数（Random Coil Index, RCI）に基づいています。RCI は、6 残基の主鎖化学シフト値それぞれが「ランダムコイルにおける化学シフト」値にどの程度似ているかを評価する指標です。ただし、主鎖の化学シフトの帰属率は少なくとも 75% 以上は必要です。75% 未満の場合、RCI の信頼性が大幅に低下します。

剛性の評価には、Floppy Inclusions and Rigid Substructure Topography (FIRST) というプログラムを使用しました。このプログラムは、rigid cluster decomposition を通じて、どの領域が剛性を持つ（rigid）かを計算します。具体的には、順次水素結合を除去し、Cα 原子がもはや剛性を保たないと判断される時点でのエネルギーを出力します。このプロセスは、熱変性に似ています。すなわち、温度を徐々に上昇させることで水素結合が次々と切れ、最終的に構造が崩壊（unfold）する瞬間の温度を計測する方法と類似しています。

ここでは、FIRST と RCI によって見積もられた flexibility の指標を比較しています。まず、相関スコアを確認します。これは、flexible な領域や rigid な領域が一致しているか、すなわち二次構造が一致しているかを評価するものです。次に RMSD スコアも算出します。このスコアが異なる場合、どちらかの指標が過度に rigid あるいは flexible と判定していることを意味します。このようなケースは、主鎖だけでなく側鎖の位置が不正確であり、水素結合や疎水性相互作用が正しく計算されていない場合に生じます。さらに、これら二つの値はそのままでは直感的に解釈しづらいため、PDB 全体を対象とした基準値で規格化したスコアを表示します。

以下、論文に記載されていた、この ANSURR の評価についてまとめていきたいと思います（非常に分かりにくい文章ですみません）。

水を加えた構造計算（ARIA を使用した refinement）を行うと、主鎖の重ね合わせでは見た目の変化はほとんどありませんでしたが、RMSD スコアは大幅に改善しました。これは、水素結合が修正され、構造がより rigid になったためと考えられます。

Decoy を作成してシミュレーションを行った場合、α -helix が多い蛋白質では「相関スコア値」が更新されていく傾向が見られました。これは、α -helix 領域は常に rigid のままである一方、ヘリックスの範囲が更新されていくためです。逆に、β -sheet が多い蛋白質では RMSD スコアが主に更新されます。これは、β -sheet の位置が正しく予測されているにもかかわらず、水素結合の位置が不安定であることに起因します。

興味深いことに、1bqz （DnaJ）の decoy では、相関スコアは高い一方で RMSD スコアは悪い結果となりました。この decoy を詳しく調べたところ、水素結合の 53% が間違っていましたが、Cα 原子の位置は実験構造とよく一致していました。また、1gh5 においては、実験構造よりも高い相関スコアを持つ decoy が見つかりました（主鎖の重ね合わせでは実験構造と類似していました）。これらの結果を踏まえると、NMR 構造計算では、パッキングや水素結合にもっと重点を置く必要があると考えられます。

Medium-long range の距離制限数と RMSD スコアの間には若干の相関が見られました。また、予想通り total-energy とも相関がありました。したがって、NMR 構造計算において energy の値を基準に最終構造を選択することは合理的であると言えます。Ensemble RMSD についても多少の相関性が認められましたが、Ensemble RMSD が改善するほどその相関性は低下しました。このため、残基あたりの距離制限数および total-energy のみが構造の正確性を評価する適切な指標となると考えられます。一方で、ensemble RMSD, dihedral-angle restraints, violation 数などは信頼性が低い指標と見なされます。なお、Ramachandran plot と RMSD スコアの間には非常に強い相関が認められました。

結晶構造との比較では、相関スコアに非常に高い一致が見られました。これは、二次構造の位置が両者で一致していることを意味します。ただし、結晶構造はクライオ温度で解析されることが多く、その結果、ループ部分の構造がやや rigid になり、相関スコアが若干低下する傾向がありました。一方で、RMSD スコアに関しては NMR 構造の方が劣っていました。これは、ループ領域で距離制限が少ないため、必要以上にフレキシブルに計算されることが原因と考えられます。

毎日エネマル

2024年11月30日土曜日

リボゾームから出てきた新生鎖の折り畳み

2024年11月21日木曜日

NMR 構造の正確さを評価する

自己紹介