2026年1月3日土曜日

IDP, IDR の帰属

この1月の一桁台の日というのが、1年のうちでもっとも憂鬱な日ですね。もっとも嬉しいのが 12/24 頃なのですが。

申し遅れましたが、本年もどうぞよろしくお願いいたします。昨年もいろいろとありましたが、なんとか持ちこたえました。来年は良くなるのか悪くなるのか、よく分からないのですが、もうあんまり悪い方に行かないのを望むばかりです。

それで、以下は、いつもの徒然ばなしです。。。。目から鱗というほどではないのですが。

ある IDP 蛋白質の帰属を進めていると(というか、トラブっていると)、15N の分解能が悪く、3次元スペクトルでピークトップをうまく拾えていないことが足かせになっている場合が多いことに気づきました。そのため、せっかく HNCACB などのピークを自動で拾っていても、1H/15N-HSQC のピークと結び付けられない、という問題がいっぱいあちこちで生じます。

Mars 自動帰属ソフトウェアを使う場合には、HNCACB などの各ピークを強制的に(つまり、手動で無理やり)1H/15N-HSQC のピークに紐づけてしまうため、この問題は回避できます。一方、Flya 自動帰属では、ソフトウェアが内部で自動的に紐づけようとするため、15N 化学シフトがずれていると、ここが大きな問題点となります。

ピークピッキングの際、15N は z 軸にあたるため、「視覚的」に確認することがあまりありません。しかし実際には、15N 軸もきちんと目で確認し、隣のプレーンのピークトップが誤って拾われていないかどうかをチェックすることが重要であると、今回初めて気づきました(これまで IDP の帰属を行ってこなかった)。Poky/Sparky では ov コマンドを用いることで、この確認が可能です(北大の久米田さんのウェブ説明書)。

さらに 20 年遅れで気づいた点として、せっかく NUS を使っているのだから、15N 軸を高分解能で取得すればよいということが挙げられます。15N は通常 constant-time(ct)で測定していますが、そのために分解能が制限されてしまいます(ふつうの fold した蛋白質では、この ct でも充分すぎるのですが)。私は個人的に semi-constant time があまり好きではなかったのですが、この場合は semi-constant time を使った方がよいだろうと感じました。IDP を日常的に扱っている人にとっては、15N を semi-constant time にするのは当然なのかもしれませんが、私は実際に帰属を進めてみて初めて実感しました。

また、フーリエ変換(NUS データのプロセス)の際もプレーン数を 256 にすればよいのですよね。zero-fill でギザギザが減れば、自動ピークピッキングも上手くいくかもしれません。これまでは杓子定規に 128 にしていましたが、現在の 10 万円以上の PC 環境であれば 256 にしても特に問題はないと思います。昔は 64 プレーンにしていたのですが、それも PC が速くなって(メモリーも 32 MB に増えて(GB ではありません))128 に増やしたのでした。

最後に HN(CA)NNH, HN(COCA)NNH の威力は絶大です(いつから測定名に N を二個重なるようになったのか?)。これの有無は、東京ー大阪間を新幹線で行くか、馬で走るかぐらいの差があると言い切れます?きっと経験者が帰属をすると、HNCACB などの 3D シリーズで7割程度まで経験と技術で進めてしまうため、これの威力を過少評価しがちです。しかし、ここは初心者の印象を聞くべきです。とある B4 生によると(すでに 100 残基の fold 蛋白質の帰属を経験済み)、この二つがない場合、それは「太平洋を浮き輪だけで渡るようなものである」と。しかし、この二つのスペクトルがあると、それは「蒸気船を得たようなものであり」「寝てても帰属できる」と形容したそうです?

私は Poky を使っているのですが、学生たちは CCPN を使っています。NMR 解析ソフト CCPN がこの HN(CA)NNH, HN(COCA)NNH を認識し、帰属の候補を出す際にこれをデフォルトで参考にしてくれるとよいのですが。

ここで一度話は終わったのですが、後になって、もう一つ書くべきことを思い出しました。それが constant-time HNCA (CT-HNCA) です。最近では、これを測定する機会はほとんどなくなってしまいました。

かつては、NMR で解析する対象が 100 a.a. 以下の比較的小さな蛋白質であることが多く、HNCA と併せて CT-HNCA を測定することが一般的でした。しかし、対象の分子量が大きくなるにつれ、CT-HNCA は重水素化蛋白質にのみ許された測定となっていきました。そのため、Bruker の標準パルスプログラムライブラリを見ても、CT-HNCA は 2H-decoupling 付きのものしか用意されていません。

そこで今回は、少し懐かしさもあって、自作して試しに測定してみました。HNCACB や CBCACONH では、13Ca, 13Cb の化学シフト展開時間を、あえて 7 – 10 ms 以内に設定します。これ以上展開すると、隣接する 13C との J カップリングによりピークが分裂してしまうためです。言い換えれば、分裂が見えないギリギリの分解能が 7 – 10 ms ということになります。

もちろん、[1-13C]-glucose や [2-13C]-glucose、あるいは同様の標識を施したピルビン酸を大腸菌発現系に用いて、Ca のみを選択的に標識する方法もありますが、それぞれに一定のデメリットも伴います。

この CT-HNCA を解析してみると、HNCACB では一つのピークに見えていた 13Ca シグナルが、実際には二つに分かれていたという箇所が数多く見つかります。やはり、CT-HNCA は不可欠な測定であると痛感しました。

もう一つ、先ほど触れた HN(CA)NNH / HN(COCA)NNH ですが、意外にも感度低下の主因となるのは、13Cb への磁化の流出です。CT-HNCA と同じ考え方で delay を調整して対処することも可能ですが、こうした場面では 13Ca-selective pulse が非常に有効です。

下記の画像は、IDP の HNCACB スペクトルの projection です。Ser の 13Cb(約 63 ppm)がやや 13Ca に近接しているものの、それ以外では 13Ca(青)と 13Cb(赤)の共鳴は見事に分離しています。したがって、適切に 13Ca-selective パルスを設計すれば、13Cb への磁化流出を防ぐことが可能です。Fold したタンパク質では、ここまでうまく分離することは難しいため、この点は IDP 用パルスプログラムの大きな利点と言えるでしょう。

13C 直接測定。。。。感度が悪すぎてダメでした。しかし、好熱菌由来の IDP などを 70-80℃ で測定する場合には、1HN は水と交換しすぎて観測が難しいので、13C 直接測定しかないでしょう。