2025年6月26日木曜日

水溶液中での本当の電荷は?

学生による論文紹介で紹介された論文です。

J. Am. Chem. Soc. 2025 Apr 30; 147(17): 14519-14529.

N. Bolik-Coulon, P. Rößler, L. E. Kay
PMID: 40237318 DOI: 10.1021/jacs.5c01567

NMR-Based Measurements of Site-Specific Electrostatic Potentials of Histone Tails in Nucleosome Core Particles.

水溶液中で蛋白質などの分子がどのような静電ポテンシャルを帯びているかは、非常に興味深い問題である。たとえば、DNA 二重らせんに巻き付く「糸巻き」に相当するヒストンには、テール(tail)と呼ばれる柔軟な末端領域が存在し、そのアミノ酸組成からは正に帯電していると予想される。しかし著者らは、以下に示す方法を用いて、このテールが実際には DNA と相互作用しており、負に帯電していることを示した。

著者らは、Gd3+ イオンをキレートした 2 種類の化合物、Gd-DOTAM-BA(正電荷)および Gd-DOTA(負電荷)を準備し、それぞれを別個に試料に添加した。もしヒストンテールが正に帯電している場合には、負に帯電した Gd-DOTA とより強く相互作用するはずである。この場合、Gd3+ の常磁性緩和により、ヒストンテールの NMR 信号は顕著に減衰するだろう。一方、テールが負に帯電していれば、正に帯電した Gd-DOTAM-BA 添加時の方が、より強い信号減衰が観察されるだろう。

このアイデアはもともと岩原先生によって提案されたものであり、後に L.E. Kay や外山先生らが別の蛋白質系に応用し、その有用性を示した。

DNA との相互作用によりテールが負に帯電していることは明らかとなったが、その程度はテールの種類によって異なっていた。たとえば、H4 テールはそれほど強く負に帯電していなかった。これは、H4 テールが Gly 残基を多く含み、DNA と結合しにくいためではないかと推測されている(Gly が多数含まれていると、そのテールはかなりフレキシブルとなる。しかし、DNA が結合するとテールの自由な動きが制限される。自然界では自由度の低下=エントロピーの減少を避ける方に傾く。もちろん、静電的相互作用とのバランスの上でであるが)。

2025年6月23日月曜日

HNCA をもっと高分解能に

学生による論文紹介で紹介された論文です。

https://pubmed.ncbi.nlm.nih.gov/29367739/

Nat Commun. 2018 Jan 24; 9(1): 356.
doi: 10.1038/s41467-017-02767-8.
Mixed pyruvate labeling enables backbone resonance assignment of large proteins using a single experiment

蛋白質の主鎖を帰属する際には、一般的に 3D HNCO, HNCACO, HNCACB, CBCACONH などのスペクトルが用いられます。しかし、分子量が 50 kDa を超えると、これら 3D スペクトルの感度が低下し、せいぜい HNCA だけが頼りになるのが現状です。ところが、この HNCA では、蛋白質中の Cα および Cβ がともに 13C で標識されているため、13Cα ピークに 1J(cαcβ) による分裂が生じてしまいます。そのため、従来の HNCA では、この分裂が目立たない程度の分解能にとどめることで対応してきました。

もし、13Cα の隣接炭素(Cβ)が 12C であるような蛋白質を調製できれば、この分裂の問題は解消されます。これまでに、[1-13C]-グルコースや [2-13C]-グルコースを用いる方法が提案されてきましたが、これらでは調製される蛋白質の半分にしか 13C が導入されないという欠点がありました。この欠点を克服する手法として提案されたのが、[2-13C]-ピルビン酸および [3-13C]-ピルビン酸の利用です。すべてのアミノ酸種で Cα が完全に 13C 標識されるわけではありませんが、両者を併用して大腸菌を培養することで *、この欠点はある程度解消されます。

さらに、これらの試薬を NaOD で処理することで(pH 13)、メチル基の水素を 2H に置換することが可能です。これにより、高い重水素化率を持つ蛋白質の調製が可能になります。

[2-13C]-ピルビン酸および [3-13C]-ピルビン酸が安価に入手できれば、大きな分子量をもつ蛋白質の帰属解析に広く利用されると期待されます。

むか~し、むか~し、4D HNCANH というパルス系列を発表しました。これを使うと、1H/15N から両隣の 1H/15N への帰属が分かるのです。今は Bruker 標準パルスプログラムで HNCANNH という名前で載っています。これの欠点は、13Cα と 13Cβ の 1J カップリングなのです。 [2-13C]-グルコースを使う手もあるのですが、当時はまだ知りませんでした。また、 [2-13C]-グルコースを使ったとしても、実質的な 13C 密度は半分になり、重水素化率も中途半端になります。しかも、価格が高いそうです。一方 [2-13C]-ピルビン酸は、これよりかは良いような気がします。

この [2-13C]-グルコースの瓶を棚に置いておいたのですが、先日みてみると、無くなっていました。誰か [u-13C6]-グルコースと間違えて使っていない?誰か、HNCACB が見えない!とか騒いでいなかったっけ?

(*)アミノ酸の生合成では、解糖系に由来するアミノ酸と TCA サイクル経路途中で作られるアミノ酸に分けられます。 前者のアミノ酸については、単純に [2-13C]−ピルビン酸から 13Cα が導入されます。ところが、後者のアミノ酸については、Cβ にも 13C が導入されてしまいます。これは [2-13C]−グルコースを使った場合でも同様です。その結果、13Cα のピークの形状がやや不均一になります(中途半端なカップリングがあるため)。しかし、著者らはこの特性を逆にアミノ酸種を推定するために利用できると主張しています。

2025年5月18日日曜日

Gln/Asn の側鎖のピーク

これは3次元 HNCA スペクトルを二次元 HN/Ca になるように、15N 軸に沿ってプロジェクション(投影)したものです。HNCA と呼ばれる葡萄パン(日本製のまだスライスしていない1斤の食パン)を上から踏んづけると、床に圧縮された二次元パンができ、そこにつぶれた葡萄がいっぱい詰まったような状態になります。



横軸: 1HN 次元   縦軸: 13Ca 次元




スペクトルの右下の方に小さいピークがちょこちょこと見えます。いつもはあまり気にしないのですが、「もしかして、これは蛋白質が不純物のプロテアーゼなどで切断されてしまった跡か?」と嫌な予感がしてしまいました。二次元 1H/15N HSQC では、C 末端の 1H/15N ピークがスペクトルの右下の方に出てきます。測定途中にプロテアーゼで切られたりすると C 末端の数が増えて、このようなピークが複数個右下に生まれてきます。そこで、ついつい(スペクトルはまったく異なるのに)右下に目が行ってしまうのは悲しい性です。

ここで、これらのピークが横方向に2個でペアになっていることにすぐに気づくべきだったのですが、それに気づかず、「何だこれ?impurity か何かかな?」と不思議に思ってしまいました。

長らく自分の手で帰属をしていないと、このような簡単なことすらも分からなくなってしまうのですが、これは実は Asn, Gln の側鎖 NH2 の箇所のピークなのです。よって、ふたつの HN ピークが横方向にペアになって現れています。

きっと Asn の 13Cβ と Gln の 13Cγ が観えてしまっているのでしょう。もし 13Ca のスペクトル幅を CBCACONH のようにもっと広くとっていれば、判りやすかったのかもしれませんが、HNCA は 13Ca のみを検出しますから、普通は狭くとります。そこで、折り返しを観てしまったのでした。「41 ppm より高磁場の 13Ca なんてあったっけ?」とちょっと不思議に思っていたのですが、BMRB の統計値と比べてみると、まさに Gln(Cg), Asn(Cb) の側鎖ですね。

Cb (Asn) 38.7 ± 1.7 ppm
Cg (Gln) 33.8 ± 1.1 ppm

Asn の側鎖:Ca - Cb - CgO - 15Nd - 1H2
Gln の側鎖:Ca - Cb - Cg - CdO - 15Ne - 1H2

これは主鎖の場合と同じく、2J(NC) で磁化移動したピークを観ているのですね。確かにしばしば帰属の論文に書かれていますが、Asn/Gln 側鎖を帰属するには、CBCACONH が使えます。Asn を例にとると、ちょうど Ca と Cb がひっくり返ったように(Ca が Cb に、Cb が Ca に)見えるはずです。Gln ですと、Ca と思ったところに Cg が、そして Cb と思ったところに Cb が見えることになります。すみません、CBCACONH は Ca も Cb も正のピークですので、このようにはならないですね。例えば、Asn では主鎖でも側鎖でも同じような 13Ca, 13Cb が見えるはずです。しかし、HNCACB ですと、主鎖の Ca が正、Cb が負のようにフーリエ変換できますので、上記が当てはまります(側鎖では Ca が負、Cb が正になる)。

今回は Bruker の標準パルスプログラムそのままで測定しましたので、折り返しのピークも正で出てきてしまいました。しかし、このような事も起こるので、たまには 13Ca 軸を 90, -180 位相でとった方がよいでしょう。あるいは、全てそのようにとらなくても、例えば帰属でペアとなるスペクトル HNCOCA だけでもとるとよいでしょう。

下図は HNCOCA の HN/Ca プロジェクションですが、右下に赤で点々とペアのピークが見えています。この HNCOCA に限っては 13Ca の軸を 90, -180 位相でとったので、これら負のピークは折り返しなのです。



なお、この Asn/Gln のピークは折り返っていて、さらに他の主鎖のピークよりもかなり小さいです。それは、Bruker の標準パルスプログラムでは、パルスプログラムの d21 が 1/(2J) に固定されており、理想的には NH2 基は観えないはずだからです。しかし、なにごとにも少し誤差がありますから、感度の高いスペクトルでは、このように小さいピークとして残渣が見えてしまうのです。そして、13Ca 次元のスペクトル幅は狭いために、側鎖が折り返ってしまう。さらに、90, -180 位相ではとっていないので、正のピークとして出てしまい、他の主鎖ピークと区別がつかなくなってしまうのです。



d21 を 5.5 ms からちょっと短めにすると、主鎖のピーク強度は少し落ちますが、今度は Asn/Gln 側鎖がはっきりと見えてきます。最近は大きめの蛋白質を重水素化して HNCA-TROSY などをとることも多いです。すると、普通の TROSY では NH2 は観えませんので、Asn/Gln のNH2 のことを忘れてしまうのですね。しかし、小さい蛋白質では、これら Asn/Gln の水素結合なども重要になってくるので、帰属をしておいた方がよいでしょう。ここで、水素結合を見ようとして HNCO-TROSY をとったりすると、また見えなくなってしまいますので、注意が必要です。

なお、Asn/Gln 側鎖のピークは、1H/15N HSQC ではペアとなって見えますが、同時に個々のピークは雪だるまのような形に見えることが多いです。胴体の上に小さな頭が載っかっているような形。なぜ、そのような形になるのかは非常に面白いので、学生さんはじめ初めて知った人はちょっと考えてみて欲しいのですが、一応、答を書いておきます。

サンプルには 90% H2O/ 10% D2O などを溶媒として使っていると思います。すると、-15N-1H-(1H) が 90% ぐらい、-15N-1H-(2H) が 10% ぐらい生じます。両者は同じところにピークが出るわけではなく、少しずれてしまうのです。前者の 15N には 1H が付いているのに対して、後者の 15N には 2H が付いているためです。これを同位体シフトと呼んでいます。よって、雪だるまの頭:胴体 = 10 : 90 ぐらいになるはずです。もし、そのようなペアのピークを見つけたら、最初は拾わずに放置しておいた方がよいでしょう。というのは、MARS/Flya などの自動帰属ソフトにかけると、これが主鎖の連鎖帰属を邪魔してしまうためです。しかし、主鎖の帰属が終わったら、ちゃんと拾って、CBCACONH などを使って帰属しておきましょう。論文を書く頃に(帰属ラベルが空白だと恥ずかしいので)そこで慌てて帰属することになります。

また、ついでながら、15N 幅を少しだけ変えて 1H/15N-HSQC をとっておきましょう。ここでずれているピークがあれば、それは Arg の側鎖 ε の可能性が高いです。本来は 85 ppm ぐらいに出るのですが、あたかも主鎖のピークのように平気な顔をして、折り返って現れますので、時々間違えて拾ってしまい、主鎖帰属を混乱させます。

HSQC スペクトルの左下の方に Trp 側鎖も出てきます。昔は、13C/15N 標識体で 1H/15N-HSQC をとると、この Trp の芳香環 13C のデカップリングが不十分で(13Ca, 13Co 選択的パルスを用いるため)、このピークだけ少しブロード化して区別がつきました。しかし、最近は Chirp のような adiabatic pulse で広く 13C をデカップルするものですから、そのような現象も見なくなってしまいました。

たまに 100 残基ぐらいの蛋白質の帰属を始めると、懐かしい現象に再会し、いろいろと楽しくなるのですが、NMR で「これは側鎖かな?」などと試案しているうちに、Cryo-EM で構造が出てしまう(しかも、ドメインではなく intact で、それも複合体で!)時代になってしまいました。さらに構造だけに限って言えば AlphFold でかなり正しい構造が出てしまいますので、NMR で構造を決定するというプロセスは、もうあまり重要ではないのかもしれません。

しかし、こと IDP/IDR (天然変性) や創薬で脚光を浴びている環状ペプチドなどとなると、なかなか Cryo-EM / AlphaFold でというわけにもいかず、NMR に頼ることになります。その際には、側鎖も含め、ほぼ全原子の NMR 帰属が必要になってきますが(特殊なアミノ酸が入った創薬では非標識!)、その経験と技術をもつ人が、もはやお年寄りになってしまいました。

2025年5月17日土曜日

あらいぐまラスカルか?

数日前 21:30 頃、駅に向かって歩いていたら、なにやら「ガリガリ」と道端で音が。「いつもの野良猫か?」と思ってよく見ると、ラスカルでした。野良猫に餌をあげている人が何人かいて、そのキャットフードの残りを漁っているようでした。写真には1匹しか写っていないのですが、隣に少なくとももう2匹いました。




実は1年前ぐらい前にも遭遇したことがあり、その時は草むらに隠れていたラスカルのしっぽを踏んでしまったようで、ラスカルが牙を向いて襲い掛かったきました。あのかわいく見えたラスカルが、あんなに狂暴な猛獣になるとは。。。

写真の質があまりよくなく、これではラスカルか狸か分からないということになり、ChatGPT に「写真のフォーカスを上げて」とお願いして出力されてきたのが下図です。あれ?ラスカルの角度も変わってしまっているので、これは単純にフォーカスを合わせたというよりかは、写真をモデルにして一から描き直したような気がしないでもない。それに食べていたキャットフードが何やらトーストみたいな物に変わっている。




ChatGPT の水彩画風というのが好きで、これもお願いしたら、下図が出てきました。上図がラスカルに見えていたのに、水彩画の方では、ちょっとおどおどした狸に化けてしまったような気もしないでもない。



ますます、「ラスカル or 狸」が分からなくなってしまったのですが、SaKKRa 先生から助言がありました。下の写真は、アメリカ在住の時に撮ったラスカルの写真だそうです。可愛く見えたらラスカルだそうです。さらに手が器用で指で物をつかめるようになっているのに対して、狸では犬のような手なのだそうです。黒いラスカルもいるのですね。汚れているだけだと思っていました。




そして、下の写真が実際に撮られた「狸」の写真。やはり可愛さでは負けていますね。



こちらに見分け方が載っていると紹介されました。
https://psnews.jp/small/p/57214/#3

それによると、目と目の間に黒い筋があるとラスカルだそうです。ピントの合っていない写真でしたが、よく見るとこの筋がありました。ということで、どうもラスカルの可能性大ですね。

テレビアニメ「あらいぐまラスカル」が放映されたのは 1977 年だそうです。50 歳以上の人でこれを知らない日本人はいないのでは?

もともとはアメリカの小説だったのですね。
https://en.wikipedia.org/wiki/Rascal_(book)

2024年12月28日土曜日

NMR で CNOT

素因数分解が NMR 量子コンピュータで解かれたのは 1998 で、それから早 26 年が経ちました。今ではむしろ NMR 以外のツールが量子コンピュータとして使われていますが、筆者にもっとも馴染みの深い NMR で、どのように量子的な計算がなされるのかは興味深いところです。

量子コンピュータの中で使われるゲートの中でもっとも基本的で、しかし重要なものは CNOT (controlled NOT) でしょう。制御ビットを Spin-I に、標的ビットを Spin-S とします。すると、CNOTゲートは、Spin-I が α( 0: 上向き)の時は Spin-S に対して何もしない、しかし、Spin-I が β( 1: 下向き)の時には Spin-S をひっくり返します。

1次元 NMR スペクトルを見ていると、上記の操作は比較的簡単にできそうであることに気づきます。例えば Spin-S が二重線に分裂していたとします。分裂する原因はすぐ近くにある Spin-I との J-coupling によるものです。つまり、Spin-I が α 状態にあるのか、それとも β 状態にあるのかによって、Spin-S の共鳴周波数が少しだけ異なり、この違いがダブレットという分裂した線形を生み出します。したがって、Spin-I が β 状態に対応する側(それがダブレットのうちの右側のピークか左側のピークかは J 結合定数が正か負かに依存しますが)に 180 度パルスを打って反転させればよいのです。それでは、Spin-S(Spin-I は β 状態)に位相 x で π パルスを打つための演算子を考えてみます。そのような演算子は

(式1)

となるでしょう。ここでは Spin-S の x 軸を回転軸として Spin-S を 180 度回転させることを想定しています。ただし、Spin-I が α 状態にある場合は何もしません。

この 4 × 4 行列を組み立てるには、Pauli の行列を用います。Iβ と Sx を表すそれぞれの 2 × 2 行列のクロネッカー積(ベクトルでいうところの外積)をとると

Iβ × Sx = {(0, 0), (0, 1)} × {(0, 1/2), (1/2, 0)}
= {(0, 0, 0, 0), (0, 0, 0, 0), (0, 0, 0, 1/2), (0, 0, 1/2, 0)}

となります。複素行列を指数とする冪乗の計算部分は少しややこしいのですが、とりあえずはこのような結果になると認めることにしましょう。

しかし、このような行列ではなく、理想的には次のようになって欲しいと思うところです。
(式2)

この演算子を、例えば状態 βα に作用させると、次式のように ββ になってくれます。

式1を式2に導くには、


のように exp(...) を二個ほど左側に追加します。ちなみに、この演算子が作用する順番は右から左になります。

しかし、これは NMR を考える際には、それほど気にしなくてもよいようです。なぜならば、実際に密度行列 Sz にこの Ucnot を作用させると(Ucnot . Sz . Ucnot^-1)となり、見かけの上では exp(-i π I β Sx) を作用させたのと同じ結果 2IzSz が得られるためです。確かに、Iz 周りの 90 度回転 exp(-i π Iz /2) は Sz や 2IzSz には影響しないですし、45 度の位相因子 exp(i π/4) も NMR の結果には特に影響しないように見えます。

いずれにしても、Ucnot は Sz → 2IzSz の変換を行う演算子となります。さて、ここでこの変換をよく見てみると、これは溶液 NMR に携わる人にとっては非常に馴染みのある変換であることに気づきます。しばしば INEPT や reverse INEPT で現れる変換です。

そこで、下図のような典型的な INEPT のパルス系列を想定してみます。INEPT の最後に Spin-I に π パルスを打っているのは、Spin-I のスピン状態を元の α か β 状態に戻すためです。

この演算子を計算していくと、最終的には、下記のような妙な行列となりますが、これも密度行列 Sz に作用させると 2IzSz が得られることが分かります。







これも Ucnot(式2)とは異なる数値ですが、Sz を軸に -90 度、Iz を軸に +90 度回し、さらに位相因子として exp(-i* π * 3/4) をかけると、なんと Ucnot ができあがるのです。z  を軸にしてスピンを回す z パルスというものは NMR に基本的にはありませんが、なぜ Iz 軸まわりに 90 度回さないといけないのかについては、興味の対象となるスピン Iz だけを見ていては分かりません。それ以外の Ix, Iy などが、この演算子によってどこに移動するのか、つまり、I や S のブロッホ球全体がどのように回転するのかまでを見ないと分からないのです。実際、この INEPT を Ix に施すと Spin-S との J-coupling が作用し、Iz を軸に 90 度の位相シフトが起こるはずです。

もし z 軸を中心として φ だけ回転させたい時には、まず x を軸に -90 度回す → y を軸に φ だけ回す → もとの x を軸に +90 度回して元の軸に戻せばよいのです。最終的には隣どうしで並んだ複数の x 位相のパルスを融合させることにより、もう少しシンプルなパルス系列にすることができます。パルス系列では、位相因子 exp(-i* π * 3/4) での補正はなされていませんが、NMR を観測する上では問題ないでしょう(この位相因子は J-coupling による展開に起因しているものと思われます)。また後述しますが、INEPT とは、制御スピン(Spin-I)が α か β 状態かに依存して、標的スピン(Spin-S)を反転させる操作でした。したがって、Spin-state-selective (S3) inversion などとも呼ばれます。

この先の内容は少し自信がありません。

初期状態は、Spin-I が α と β の重ね合わせ状態にあり、Spin-S が上向き α 状態にあるとします。この時、Spin-S を観測したとしても、Spin-I の状態を一義的に決めることができないので、これはエンタングル状態ではありません。ところが INEPT を経た後では、Spin-I が α であれば Spin-S は上向き α に、逆に Spin-I が β であれば Spin-S も β 下向きとなります。Spin-I で何が観測されるかによって、Spin-S で観測される結果が決まります。また、逆も然りで、Spin-S を観測すると Spin-I の状態を決めることができますので、これはエンタングル状態と言えます。なお、Spin-S の初期状態を下向きとした場合、Spin-I が α であれば Spin-S は下向き β に、逆に Spin-I が β であれば Spin-S は上向き α になります。これもエンタングルメントです。

Spin-I ベクトルが x を向いている時、この一個のスピンを z 軸に沿って観測すると、+1/2, -1/2 が等しい確率で現れますが、事前にどちらの値をとっているかは未定です。したがって、これは α 状態と β 状態の重ね合わせ状態になっているといえます。もし、Spin-S が α 状態であれば、この状態は (Iα + Iβ) Sα と表されます。これに INEPT を施すと、Spin-I が β 状態の時のみ Spin-S が反転するため、結果として IαSα + IβSβ となります。Spin-I を観測すると、それによって Spin-S の状態も分かるため、両者はもつれ合っていると言えます。

なお、初期状態で Spin-I ベクトルが z 方向を向いている時、これを z 軸に沿って観測すると、必ず +1/2 という値が返ってきます。よって、これは重ね合わせ状態にはありません。NMR 静磁場の中には、天球上のいろいろな点を向いたスピンベクトルが存在すると考えることができます。そのうち、Spin-I ベクトルの向きが赤道に近づくほど α:β が 1:1 の重ね合わせ状態に近づきます。静磁場の中では、Zeeman 相互作用のために、北半球を向いたスピンベクトルの方が若干多いことになりますが、今の議論では無視できるほどの差でしょう。しかし、DNP などにより北半球を向いたスピンベクトルの割合が圧倒的に多くなれば、90 度(hadamard)パルスを事前に打って、重ね合わせ状態を人為的に作る必要があるでしょう。この辺りは、個々のスピンを扱う量子コンピュータと、多くのスピンのアンサンブルを扱う量子コンピュータとの違いではないかと理解しています(間違えているかもしれません)。

2024年11月30日土曜日

リボゾームから出てきた新生鎖の折り畳み

以前にもご紹介したことがあるかもしれません。今回は(熱力学の議論も入り)ちょっと難しい内容で、きっちりとは理解できませんでした。「一応、こうかな?」と自分なりに理解したところを書いてみましたが、間違えているかもしれません。

J.O. Streit, J. Christodoulou (2024) The ribosome lowers the entropic penalty of protein folding. Nature 633(8028): 232-239. doi: 10.1038/s41586-024-07784-4.
PMID: 39112704

普通の水溶液中での単離された蛋白質と比べて、リボゾームから出てきたばかりの(まだリボゾームにつながっている状態での)新生鎖は、以下の点で異なる。

リボゾームの出口から出てきた新生鎖は、比較的のびた構造をとる。そのため広い表面積 SASA が水和し、水和のエントロピーの点からは unfold 状態が不安定になる *1。さらに、揺らぎが制限され、とりうる構造の種類も少なくなるため、新生鎖の構造エントロピーの点でも unfold 状態が不安定になる *2。この構造の制限のために球状の構造をとりにくくなり *3、さらに、リボゾーム表面の負電荷の影響により、エンタルピーの点で fold 状態も不安定になる *4。よって、フリーの蛋白質に比べて |-TΔS| も |ΔH| もともに小さくなる *5。この特徴は配列にあまり依存せず、新生鎖はリボゾームの上では fold 状態も unfold 状態も(フリーに比べて)不安定といえる。この影響はリボゾームから離れるほど弱くなる *6。In vitro では不安定性を起こしてちゃんと fold しないような変異体においても、リボゾームの上ではその unfold 状態も fold 状態も不安定になり、wt と似た folding 中間体を経て、無事に fold される率が上がる(緩衝効果)。

(*番号の注釈)

*1 水は束縛されずに自由に泳ぎ回る方を好む。しかし、unfold した蛋白質では表面積が広がり、より多くの水が表面に水和し束縛されるので(水和エントロピーの低下)、水の立場にたつとこれは嫌なことである。シミュレーションによると、新生鎖はフリーな unfold 蛋白質より大きな SASA(水が接触できる表面積)をもつそうである(誇張すると、リボゾーム上では伸びきっている)。また、水と蛋白質表面が相互作用すると、その間で水素結合が形成されるため、水和のエンタルピーという点でみると、SASA が大きくなることは unfold にとって好ましいといえる。しかし、著者らによると、その寄与は小さい(エントロピー低下に負けてしまう)とのことである。

リボゾームについた状態では folding の熱容量 ΔCp が大きい。ちょっと難しいが、これは unfold 状態で SASA が増えることを意味している。Fold 状態では内部に隠されていた疎水的なアミノ酸が、unfold 状態では表面に露出する。これが ΔCp が大きくなる原因らしい。ただし、ΔCp の温度に対する変化は小さい。

*2 Unfold した蛋白質はその中の原子が自由に動き回れるので、蛋白質の構造エントロピーの点では unfold 状態は好ましい。しかし、リボゾームから出てきたばかりの時は、C 末端側が巨大なリボゾームに掴まれ自由な運動が制限されてしまうため、蛋白質はこの延びたままの unfold 状態を嫌う。

*3 新生鎖は大きなリボゾームにつながっているため、それが邪魔をして丸いコンパクトな構造を取りにくくなると考えられる(立体排除)。すると、本来の fold 状態でとるべき水素結合、静電的相互作用、疎水的相互作用(ファンデルワールス相互作用)がとれないので、エンタルピーの点で好ましくない(エンタルピーの絶対値の低下)。

*4 リボゾーム表面の負電荷の影響により、リボゾームにつながったままの新生鎖の中では、本来 fold 状態でとられるべき静電的相互作用がうまく働かないのだろう。

*5 フリーな蛋白質では |-TΔS| も |ΔH| もともに大きい。しかし、fold 状態と unfold 状態のどちらの分子数が多くなるかは、両者の差 ΔG = ΔH - TΔS で決まり、その差はお互いにかなりがキャンセルしあって、ごく僅かとなる。これを marginal stability とよぶ。もし ΔG が0ならば、fold/unfold は 50:50 である。

新生鎖では、 |-TΔS| も |ΔH| もともに小さくなってしまうが、ΔG が最終的にどうなるかについては明記されていない。いずれにしても、フリーな蛋白質とは異なるエントロピー、エンタルピーの大きさ(絶対値)となるため、フリーな蛋白質ではとらないような folding 中間体の構造をとることがある。この中間体は活性のある酵素にちゃんと fold するために重要な場合がある。例えば HRAS では 1H/15N-HSQC がほとんど同じに観えても、in vitro で refold させた場合は活性がない。おそらく、in vitro の refolding では、途中で inactive な構造にトラップされてしまうのだろう。しかし、ちゃんとリボゾームから出てきた場合にはもちろん活性を維持していることから、active な構造に向かう際の folding の道筋が、リボゾームにつながっている時とそれから離れている時とでは異なっているのかもしれない。

*6 とはいえ、かなり遠くでも効いていることから、新生鎖とリボゾーム表面の負電荷との直接的な相互作用はあってもその寄与は小さい。実際、負電荷だらけの poly-Glu で試しても、WT と大差はなかった。よって、この特徴は配列にあまり依存しない。

(補足)

エンタルピー:水素結合、静電的相互作用、疎水的相互作用(その中のファンデルワールス相互作用)など、お互いに引き合う作用が増えるほど、エンタルピーはより負になり(絶対値が大きくなる)、その状態が安定化してその分子数が増える。これらの相互作用が形成されると熱が放出される。この発熱がエンタルピーに相当すると考えてもよい(熱が外へ逃げていってしまうので負の値になる)。しかし、これがいえるのは定圧条件下だけである。しかし、蛋白質を高圧や低圧の中で実験する例は(高圧 NMR 実験のように)かなり特殊であろう。

エントロピー:原子や分子が自由に動け回れるほど大きくなり、そして好ましくなり、その分子数が増える。つまり、制限や束縛は嫌ということ。蛋白質の fold/unfold を考える時、蛋白質分子の中の原子だけを考えていたらだめ。蛋白質は真空にあるのでなく水中にあるので、水分子の水和エントロピーも考えなくてはならない。これが、疎水的相互作用(その中の水和部分)に相当する。よって、疎水的相互作用と一言にいっても、ファンデルワールス相互作用(エンタルピー的寄与)と水和(エントロピー的寄与)の二つに分けられる。

餃子の漬け汁では、お酢の中にラー油を入れる。すると、いくら箸でかきまぜても1分もするとラー油がお皿の真ん中あたりに寄り集まってしまう。水分子はラー油の周りにトラップされ動けなくなる。これは水にとって大変嫌なことである。よって、水はそこから解放されたい。少しでも水を解放するには、ラー油の集まりができるだけ一つになればよい。集まるほど、表面積の合計が少なくなるのは感覚的につかめるだろうか?

1 cm 辺のサイコロが2個あるとする。その二つの表面積の合計は 12 である。ところが、その二つのサイコロを接触させてしまうと、その直方体の表面積は 10 になるのかな?

話を元に戻そう。よって、水とラー油が反発しあうわけではなく、あくまで自然のなりゆきで気がついたら(水に嫌われた)ラー油が集まってしまう。これが水和エントロピーの効果。ところが、ラー油は集まってみると、お互いラー油どうしで引き合うことに気がつく。そして、がっちりと手を結んでさらに固まってしまう。ファンデルワールス相互作用と呼ぶが、これがラー油のエンタルピー効果。

もうひとつ例を。南極では寒い北風ブリザードが吹くので、ペンギンの子供達は自然に集まってくる。これはペンギンのエントロピー効果。ところが集まってみると、お互い羽がないと思っていたのに手もあることに気づき、手を結びあって団子になり寒さに耐える。これがペンギンのエンタルピー効果。

蛋白質の folding も餃子やペンギン?と同じ原理で進む。

自由エネルギー:ΔG = ΔH - TΔS で表される。厄介なのはマイナス符号である。ΔS というとエントロピーどうしの差であり(論文では S(fold) - S(unfold))、ΔS が増えるほど fold 状態のモル数が増える。しかし、-TΔS と実際にはマイナスの数値として自由エネルギーに寄与するため、自由エネルギーの点ではこれが下がるほど fold 状態が安定になる(論文では unfold 状態が不安定化する)。よって「エントロピー値 S が増減する」と「エントロピー的寄与 -TΔS が増減する」は真逆の状況を指すため、注意が必要である。おそらく「エントロピー的に fold 状態が安定(unfold 状態が不安定)になる」という表現の方が無難と思われる。

エントロピー S は必ず正の数となる。しかし、ΔS は S どうしの差であるため(例えば、論文では fold 状態の S から unfold 状態の S を引き算した値)正負両方の数をとり得る。そこに -T が掛け算されるので、ますます誤解を招きやすい。さらに、S(unfold) - S(fold) で表現する文献もあるので、初心者はさらに混乱する。

なお上記の発熱(エンタルピー)によって、水を含む周りの環境が熱せられ、その結果、水分子の運動性が上がる。これによって、周り(水環境の)エントロピーが上がるわけだが、このような環境のエントロピーも考慮できれば、(蛋白質の)自由エネルギーの代わりに(蛋白質と水の)エントロピーだけで、安定性を議論することができる。エントロピー増大の法則はこのようなケースに使える。

例えば、細胞の中では核やミトコンドリアなど見事な秩序が保たれている。これはこの細胞内オルガネラのエントロピーが下がることを意味する。ここで、自然界はエントロピー増大に向かうはずなのにおかしいなどと思ってはいけない。実は、この秩序を形成する際に熱が出て、細胞質の水分子の運動を激しくしてしまっているのである。このため、水のエントロピーは上がってしまう。では、二つのエントロピーを足し算するとどうなるのか?必ず正の数になる。これがエントロピー増大の法則。この両者の和がもし0になったら、それは永久の命を得たことを意味する(熱力学の教科書では永久機関と称されるが、これを作れたら、ノーベル賞をいっきに百個ほどもらえる)。

熱力学は難しくて、理科の中ではあまり人気がない。しかし、圧力一定という条件を付せば、かなり感覚にマッチしてくる。エントロピー増大は自由が増大(低下は束縛)、エンタルピー低下は熱が逃げる(増大は熱を得る)と覚えれば、学問的には正解とはいいがたいが、まあ使える。

2024年11月21日木曜日

NMR 構造の正確さを評価する

ソフトウェア ANSURR

https://ansurr.com/

N.J. Fowler, A. Sljoka, and M.P. Williamson (2021) The accuracy of NMR protein structures in the Protein Data Bank. Structure 29 (12) 1430-1439.e2.

この ANSURR というソフトウェアに関する論文を読んでみた結果、NMR 構造の「正確さ」(精密さではありません)を見積もる手段として、非常に有用であるように思われます。これまで NMR 構造の正確性を評価する指標はあまり存在していませんでした(構造計算に使わない RDC などは良いデータでしょう)。そのような状況において、Ramachandran 解析は geometry を評価する上で最適な手法の一つと考えられます。一方で、例えば 20 個の NMR 構造を計算して得られる重ね合わせ時の rmsd 値は、精密さを示す指標としては適切ですが、正確さを示すものではありません(例えば、20 個全てが同じ間違えた構造に収束していたような場合、rmsd は良い値になりますが、それらは不正確です)。特に、主鎖の重ね合わせが良好な結果を示していても、側鎖がばらついていたり、水素結合が誤っていることも多々あり、これらの問題がその後のドッキングやダイナミクス解析に悪影響を与えている可能性があります。また、距離制限の残基あたりの数も、正確性を評価する上でそれほど良い指標とは言えません。これは、NOE を距離制限に変換する際に user-defined な方法が介入するためであると考えられます(ノイズとピークの判断は主観的ですし、また、大きな NOE は 3 Å程度などと主観的に距離を制限している場合が多い)。

この ANSURR 法の中核は、主鎖の化学シフト値を用いて主鎖の局所的剛性を計算する点にあります。この計算は、ランダムコイル指数(Random Coil Index, RCI)に基づいています。RCI は、6 残基の主鎖化学シフト値それぞれが「ランダムコイルにおける化学シフト」値にどの程度似ているかを評価する指標です。ただし、主鎖の化学シフトの帰属率は少なくとも 75% 以上は必要です。75% 未満の場合、RCI の信頼性が大幅に低下します。

剛性の評価には、Floppy Inclusions and Rigid Substructure Topography (FIRST) というプログラムを使用しました。このプログラムは、rigid cluster decomposition を通じて、どの領域が剛性を持つ(rigid)かを計算します。具体的には、順次水素結合を除去し、Cα 原子がもはや剛性を保たないと判断される時点でのエネルギーを出力します。このプロセスは、熱変性に似ています。すなわち、温度を徐々に上昇させることで水素結合が次々と切れ、最終的に構造が崩壊(unfold)する瞬間の温度を計測する方法と類似しています。

ここでは、FIRST と RCI によって見積もられた flexibility の指標を比較しています。まず、相関スコアを確認します。これは、flexible な領域や rigid な領域が一致しているか、すなわち二次構造が一致しているかを評価するものです。次に RMSD スコアも算出します。このスコアが異なる場合、どちらかの指標が過度に rigid あるいは flexible と判定していることを意味します。このようなケースは、主鎖だけでなく側鎖の位置が不正確であり、水素結合や疎水性相互作用が正しく計算されていない場合に生じます。さらに、これら二つの値はそのままでは直感的に解釈しづらいため、PDB 全体を対象とした基準値で規格化したスコアを表示します。

以下、論文に記載されていた、この ANSURR の評価についてまとめていきたいと思います(非常に分かりにくい文章ですみません)。

水を加えた構造計算(ARIA を使用した refinement)を行うと、主鎖の重ね合わせでは見た目の変化はほとんどありませんでしたが、RMSD スコアは大幅に改善しました。これは、水素結合が修正され、構造がより rigid になったためと考えられます。

Decoy を作成してシミュレーションを行った場合、α -helix が多い蛋白質では「相関スコア値」が更新されていく傾向が見られました。これは、α -helix 領域は常に rigid のままである一方、ヘリックスの範囲が更新されていくためです。逆に、β -sheet が多い蛋白質では RMSD スコアが主に更新されます。これは、β -sheet の位置が正しく予測されているにもかかわらず、水素結合の位置が不安定であることに起因します。

興味深いことに、1bqz (DnaJ)の decoy では、相関スコアは高い一方で RMSD スコアは悪い結果となりました。この decoy を詳しく調べたところ、水素結合の 53% が間違っていましたが、Cα 原子の位置は実験構造とよく一致していました。また、1gh5 においては、実験構造よりも高い相関スコアを持つ decoy が見つかりました(主鎖の重ね合わせでは実験構造と類似していました)。これらの結果を踏まえると、NMR 構造計算では、パッキングや水素結合にもっと重点を置く必要があると考えられます。

Medium-long range の距離制限数と RMSD スコアの間には若干の相関が見られました。また、予想通り total-energy とも相関がありました。したがって、NMR 構造計算において energy の値を基準に最終構造を選択することは合理的であると言えます。Ensemble RMSD についても多少の相関性が認められましたが、Ensemble RMSD が改善するほどその相関性は低下しました。このため、残基あたりの距離制限数および total-energy のみが構造の正確性を評価する適切な指標となると考えられます。一方で、ensemble RMSD, dihedral-angle restraints, violation 数などは信頼性が低い指標と見なされます。なお、Ramachandran plot と RMSD スコアの間には非常に強い相関が認められました。

結晶構造との比較では、相関スコアに非常に高い一致が見られました。これは、二次構造の位置が両者で一致していることを意味します。ただし、結晶構造はクライオ温度で解析されることが多く、その結果、ループ部分の構造がやや rigid になり、相関スコアが若干低下する傾向がありました。一方で、RMSD スコアに関しては NMR 構造の方が劣っていました。これは、ループ領域で距離制限が少ないため、必要以上にフレキシブルに計算されることが原因と考えられます。