2017年1月20日金曜日

ぬすでも悪くなさそう。

同じ NMR 測定時間をもらった時、積算回数を増やすべきか、それとも、サンプリングの点数を増やすべきかは迷うところです。もちろん間接測定軸についての話です。まだ2次元の場合は、このような迷いで済むのですが、話が4次元になってくると「積算回数を増やしたいけれど増やせない」さらに悪いことに「サンプリング数を増やしたいけれど増やせない」といった事態になります。例えば積算回数2をちょっと8にでも上げようものなら、測定時間3日間が一気に 12 日間に跳ね上がります。そこで、使いたい方法が non-uniform-sampling です。この NUS の説明は超長くなるので今回は止めておきます。もちろん、そのプロセスの話も読むだけで何日もかかりそうですので止めておきます。

今まで NUS については面倒でほとんど試さなかったのですが、Delaglio さんから勧められて一度つかってみることにしました。使った理由の一つとして「NUS ではなくて普通の uniform-sampiling で測定したデータでもプロセスできるよ」と言われたことも大きいです。

最初は半信半疑で 2D HSQC で試しに使ってみたのですが、これが悪くないのです。そこで、感度の悪い 3D HN(CA)CO に使ってみました。NUS ではなくて US です。したがって、いつも通り NMRPipe の Linear Prediction を 15N, 13C の両軸にかけました。ご覧の通り、二つのピークがマージしてしまっている箇所があります。蛋白質は 2H, 15N, 13C 標識されていますが、分子量は5万ぐらいで濃度は 50μM です。温度は 25度、塩が 100mM 入っていますので、それほど良い条件ではありません。


ところが、同じデータに対して NMRPipe の NUS zero-fill(IST 法)をかけてみると、その二つのピークが分離しました。


そこで、今度は本当に NUS で測定してみました。4D HCCONH です(測定法の名前に何個の C を入れるかは、あまりよく決まっていないのでは?)。まだ半信半疑でしたので、3D (H)C(CO)NH と 3D H(CCO)NH も、これらは US でとりました(何しろ良し悪しを判断するための基準となりますから)。Windows がもはや走らなくなった old-PC をもらってきて Cent-OS-6 と NMRPipe を入れスタート!すると、何やらよく分からないエラーの嵐が。。。これで何日も悩むことに。結局よく分からず Delaglio さんに尋ねました。すると「32-bit で計算しているためですよ」と言われ、たいへん恥ずかしい思いをしました。そうです、ファイルサイズが大きくなると 64-bit モードに変えないとダメなのです。やはり4次元の世界ですねえ。そこで、NMRPipe を 64-bit でインストールし直して計算しなおしました。しかし、帰宅する頃になっても終わらず、翌朝に来て見てみてもまだ計算しています。翌日の晩にも終わらずで、とうとう3日目のお昼を迎えました。終わった!恐る恐る(あまり期待しないで)スペクトルを見てみたところ、これが意外にもなかなかきれいなのです。


ここまで上手く行くようになると、NUS の欠点は、おそらくファイルサイズと計算時間だけとなるでしょう。Zero-fill をだいぶん減らして何とか 2.6 GB に抑えました。しかし、プロセスの最中に何度もデータを読み書きしているので、ハードディスクにはちょっと可哀想です。まあしかし、久しぶりにコンピュータをメール、オフィス、ウェブ以外に使うことができたので、計算機もさぞかし喜んでいることでしょう。

ここで 4D HCCONH を選んだ理由は、側鎖の帰属において 1H と 13C の間の相関を正しくとりたかったためです。3D (H)C(CO)NH と 3D H(CCO)NH の二つの組み合わせだけでは、例えば、1Hg と 13Cd の化学シフトを組み合わせてしまうような間違いが起こってしまうのです。

最後に NUS の名誉にかけて。3D-LP と 4D-NUS を見比べると、前者の方がピークがたくさんあり感度が高いように見えます。しかし、表示されている 2D plane にピークがたくさんある時には、喜ぶ前にあることを疑わないといけません。「もしかして、ひしゃげた葡萄の入った食パン一斤をスライスしてしまったのでは?」と。そうです、糖密度の高い貴腐干し葡萄が入った食パンをスライスした時には、その二次元スライスに含まれる葡萄の数はむしろ少なく見えるのです。

2017年1月9日月曜日

ミルヴァット法

1 MDa に近い大きさの蛋白質を NMR で解析しようとすると、もはや 1H-15N の TROSY では歯が立たなくなります。たとえ、それ以外の水素を全て重水素化していてもです。そこで最近はやり出した方法が 1H-13C メチル基です。もちろん、それ以外の水素は 2H 化されています。1H-13C TROSY の方が、その感度はいろいろな原因で 1H-15N TROSY を凌ぎますので、今後はメチル基が高分子での観測対象となっていくことは間違いないでしょう。

しかし、ここでの問題点はどのようにして帰属するかです。もはや 1H-15N TROSY が使えないような高分子量では、そもそも主鎖の連鎖帰属されていません。仮に主鎖が帰属できたような幸せな状況であっても、メチル基とアミド基の間の相関をとるのはもっと大変です。すでに提案されている 13C-13C TOCSY は超大きな蛋白質では 13C の速い横緩和のため難しいでしょう。13C の遅い縦緩和を考えると、まだ 13C-13C NOESY を使った方がましかもしれません。そこで使われる手段は、一個一個メチル基を含むアミノ酸を別のアミノ酸に変異させていく方法です。一個のアミノ酸を変異させると空間的な周りにも大きな影響を及ぼして多数のピークが同時に動いてしまう場合もありますが、まあ大体はうまく行くことでしょう。問題点は、大量の変異体を作っては測らないといけないことです。

もう一つの手段は、すでに X 線結晶構造解析で立体構造が分かっている場合に限られるのですが、メチル基どうしの NOE と立体構造を見比べながら帰属する方法です。NOE は 1H と 1H がだいたい 5A 以内にある時に観えます。もし、メチル基以外を重水素化すると、もうちょっと限界値が伸びて 7A ぐらいまで NOE が届きます。これまでは Ile, Leu, Val の3種類の残基のメチル基だけしか 1H/13C で標識されていないことが多く、その場合、メチル基からメチル基へ NOE で連鎖的に飛んでいくには、ちょっと密度が薄かったようです。(川を渡るのに、 Ile, Leu, Val だけでは飛び石の間隔がちょっと広くて、途中で渡れなくなるような感じ)。しかし、Met, Ile, Leu, Val, Ala, Thr の6種類の残基のメチル基を 1H/13C で同時に標識すれば、7A の範囲内に別のメチル基が全くいないという「ひとりぼっち」の状況にはなりにくいのでしょう(見渡せば次に飛び移れる石が必ずどこかに見つかり、いわゆる川ポチャ現象は防げる)。そして、帰属には4次元の 13C-HMQC-NOESY-HMQC を使います。

Proudfoot, A., Frank, A.O., Ruggiu, F., Mamo, M., and Lingel, A. (2016) Facilitating unambiguous NMR assignments and enabling higher probe density through selective labeling of all methyl containing amino acids. J. Biomol. NMR. 65 (1), 15-27. doi: 10.1007/s10858-016-0032-2.

20 年以上前までよく4次元を使っていたのですが、「当時は」測定は途中でしばしばフリーズするし、フーリエ変換に overnight かかるし、ハードディスクが満杯になるしで、悪戦苦闘状態でした。それでだんだんと3次元だけに頼るようになっていました。しかし、最近はやりの NUS が出てから再び4次元に光が当たってきたように思います。私の好きな方法は、普通の uniform-sampiling でとったスペクトルをあたかも NUS でとったかのように騙して NMRPipe の IST 法でプロセスする方法です。騙されているのは私の方かもしれませんが、見違えるほどきれいなスペクトルに変身するのです。これの良い点は、non-uniform-sampling でとったわけではないので、普通の linear-prediction(LP)法も使えて、両方のスペクトルを比べることができる点です。これですと、非線形的なプロセスで変なアーティファクトが出たとしても、元の LP 版に戻れば OK で、測定時間を無駄に捨ててしまったという事態にはなりません。Delaglio さんにはこれまで一杯お世話になりましたので、お礼を兼ねてまた詳細をご紹介したいと思います。4次元は「~あなたの知らない4次元の世界~」などと恐れる人も多いですが「二次元 × 二次元」or「N × 三次元」という概念さえ納得してしまいさえすれば、これほど解析しやすいスペクトルはありません。それに修論発表などで「4次元スペクトルを解析しました。」などと言う方が格好良くありませんか?

話を元に戻しましょう。著者らは、ホモ6量体、115 kDa の蛋白質においてメチル基だけを 13C/1H で標識しています(メチル基を含むアミノ酸は全体の 44% を占めたそうです)。これの帰属がこれまでの大きな問題だったのですが、彼らは Met, Ile, Leu, Val, Ala, Thr のメチル基を標識し、すでにある結晶構造をもとに帰属をつけました(Ile-Cγ2 は除く)。

発現用の大腸菌は 15NH4Cl (1 g/L), 非標識の Glucose (4 g/L) を入れた M9 培地で培養し、少しずつ D2O に適応させています。OD600nm が 0.7 になった時点で温度を 18 度にまで下げ、同時に選択的標識の前駆体やアミノ酸を入れています。そのまま 1hr 培養した後、IPTG で誘導をかけて 18 度のまま 18hr 培養し、蛋白質を発現させています。どのような前駆体を入れるかは Table にまとめられているのですが、これまで発表されている方法を集めたような感じになっており、特に目新しい点はないようです。しかし、個々の前駆体を別々に入れて、アミノ酸を1~2種類ずつ標識するか、あるいは、6種類分すべてを同時に入れるかで、scramble の結果が少し違ってくるかもしれません。

一般的に 2-keto-3-methyl-d3-3-d1-4-13C-butyrate(2-オキソイソ吉草酸)だけを培地に入れると、Leu と Val の両方のアミノ酸のメチル基が標識されてしまいますが、ここに BioExpress を入れると Val だけが標識されます。

しばしば Ala-13Cβ 前駆体が Ile-13Cγ2 に scramble するのですが、MILVAT 法では、700 mg/L まで Ala 前駆体を増やしても scramble が観られなかったそうです。また、Ala-Cβ 自身が 13C で標識される率についても、100 g/L と 700 g/L とで差がほとんど見られなかったそうです。流れる先のアミノ酸の前駆体をすでに入れているためでしょうか?ここの理由はよく理解できませんでした。

Thr-Cγ の標識のために d5-Gly を入れています。これの詳細については、またいつかご紹介することにします。

ところで [2H]-glucose を入れなくて良いのでしょうか?著者らも [2H]-glucose を入れた方が良いだろうとは書いていますが、質量分析の結果、たとえ 非標識の glucose であっても、アミノ酸1個につき平均1個の 1H しか混入しなかったことが分かったそうです。確かに 2D 1H-13C HMQC の全体像を見ると、1H の混入はあまり無さそうですが、個人的には気になるところです。

また、上で「2-keto-3-methyl-d3-3-d1-4-13C-butyrate」と書きましたが、この2-オキソイソ吉草酸では2個のメチル基のうち一方は 13C/1H3 に、もう一方は 12C/D3 になっています。なお、Pro-R, Pro-S のどちらかに決まっているわけではありません(つまり、立体特異的には区別されていない)。しかし、両方ともに 13C/1H3 があるわけではありませんので、2D スペクトルには両方のピークが観えるものの、1H どうしの双極子間相互作用による T2 緩和は免れます。しかし、この論文で書かれている試薬番号をサーチしてみると、どうも2つのメチル基が両方とも 13C/1H3 になっているようなのです。すると、1個の分子内でこの双子のメチル基の間で NOE が観測されるのと同時に、T2 緩和も速くなってしまいます(Geminal なメチル基の間に NOE が出るためには、ある分子を一個拾い上げた際に、その中のメチル基が二つとも 13C/1H3 になっている必要があります。しかし、ただ単に 2D 1H-13C HMQC の上に両方のピークを見たいだけであるならば、半分の分子では Pro-R 側に、残りの分子では Pro-S 側に 13C/1H3 が入っていればよく、両方とも同時に 13C/1H3 にする必要はありません。将来いつか、たった1個の蛋白質分子だけで NMR の構造解析が可能となる日が来ると思いますが?その時にはこの議論が重要性を帯びてきます)。

この MILVAT の試料と、M, I, L, V, A, T それぞれで標識した試料とを使って、6割のメチル基が帰属できたとのことです(もっと効率が高いと思っていたので、この時点で少しがっかり)。しかし、論文の NOESY の図を見ると、標識されたメチル基が多過ぎて却って複雑に見え「メチル歩き」が本当にできるのかな?と疑ってしまいます。しかし、著者らは観測できるメチル基のピークが多く冗長な(redundant)な方が、かえって信頼性が上がるとも書いています。MILVAT 試料以外に、M, I, L, V, A, T 別々の標識試料、合計7種類の試料が少なくとも必要になってきますので、そう簡単というわけではなさそうですが。前回の OD600nm=10 法と組み合わせると良いのでしょうか?

2017年1月2日月曜日

大腸菌培養の最少培地 M9 その2

NMR で蛋白質の立体構造やダイナミクスを解析する際には、その蛋白質が 15N, 13C などの安定同位体で(均一に、あるいは選択的に)標識されていることが今ではほぼ必須です。分子量が 20k を超える場合には、さらに 2H でも標識されていた方がよいでしょう。15N/13C の価格は 20 年前に比べて落ち着いてきてはいるものの、2H 化グルコース、重水の価格は今も高く、これがラベル化蛋白質を作る際の大きな壁になっています。

Cai, M., Huang, Y., Yang, R., Craigie, R., and Clore, G.M. (2016) A simple and robust protocol for high-yield expression of perdeuterated proteins in Escherichia coli grown in shaker flasks. J Biomol NMR 66(2), 85-91.

この論文では、培地の量を 1/10 に減らして、同じ量の蛋白質を得ることができることを示しています。これは嬉しいことです。なにしろ培地の溶媒である重水の量を 1/10 に減らすことができるわけですから。ただし、[2H, 13C]-glucose の量は 18 g/L、[15N]-NH4Cl が 5 g/L と濃度で見るとすこぶる多いです。しかし、1L の培地に今まで通り 2g/L の [2H, 13C]-glucose を入れるのと比べると、トータル量はあまり変わらない、否むしろ少ないぐらいですので驚きです。

このグルコース豊富な培地で菌体を OD600nm が 10 か、それ以上になるように育てます。個人的な経験では重水培地(1-2 g/L のグルコース入り)では OD600nm はせいぜい1ぐらいまでしか上がりません。グルコースの量を増やすほど大腸菌がよく育ち、また発現量も多いことから、この頭打ちはグルコース量の枯渇によるものなのでしょう。確かにこの論文通りに事が運ぶと、1/10 量の培地で同じ量の蛋白質がとれるはずです。

一般的に企業ではよくファーメンターを使います。すると(リン酸緩衝液いりの)LB 培地で OD600nm が 20~30 ぐらいまで上がると聞いたことがあります。これはファーメンターでは空気を金魚の水槽のようにぶくぶくと与え、さらに電極がいつも培地の pH を監視していて、もし pH が下がると上から水酸化ナトリウムが垂らされるようにできているためです。

しかし、フラスコを左右に振っている状況では、そう上手くはいきません。そこで、この論文ではバッフル付きのフラスコに培地をほんの少しだけ入れ(だいたいフラスコ容量の 1/10 ぐらい)、よく酸素を培地に溶け込ませて酸欠を防いでいます。確かにうちでは 3L のフラスコに 1L ぐらいの M9 培地を入れていました。これでは培地が深過ぎて十分な量の空気が培地に行き渡らないのでしょう。

さらに pH が下がらないように注意しています。確かに大腸菌が育つにつれて培地の pH が下がってきます。極端な例は乳酸菌で発酵させたヨーグルトで、ここには大腸菌は住めません。実は M9 培地には pH があまり下がらないようにリン酸緩衝液の成分が入っており、これは前回に記した通りです。しかし、この論文では「改良型 M9」と称して、このリン酸バッファの成分を少し工夫しているのです。そこで、うちの成分とちょっと比べてみました。

いつも我々が使っている M9 プロトコール
 Na2HPO4  7 g(Na:2.27 g, PO4:4.68 g)
 KH2PO4  3 g(K:0.86 g, PO4:2.10 g)
 NaCl  0.5 g(Na:0.20 g, Cl:0.30 g)

面倒だったのですが、元素ごとに量もそれぞれ計算してみました。
 Na:2.47 g
 K:0.86 g
 PO4:6.78 g
 SO4:M9 salt の中には含まれてはいないが MgSO4 から 0.19 g 補われる。
 Cl:0.30 g

この論文に記載されている改良型 M9 プロトコール
 Na2HPO4  9 g(Na:2.92 g, PO4:6.02 g)
 KH2PO4  5 g(K:1.43 g, PO4:3.49 g)
 K2HPO4  19 g(K:8.52 g, PO4:10.37 g)
 K2SO4  2.4 g(K:1.08 g, SO4:1.32 g)

これについても元素ごとに量を計算してみました。
 Na:2.92 g
 K:11.03 g
 PO4:19.88 g
 SO4:1.32 g
 Cl:M9 salt の中には含まれてはいないが、NH4Cl, MgCl2 などから補われる。

Na, Cl の量はそれほど変わらないとしても、我々の方法では K, P, S の量が圧倒的に少ないです。pH や浸透圧を調整できれば、これらの量は多い方が良いのでしょうか?塩分控えめ、にがり多し?我々のレシピで Na, K の濃度を合算すると 129 mM と、生理的食塩水の 140 mM に近くなります。さらに Cl 濃度なども足すと、おそらく生理的食塩水濃度 140 mM となるでしょう。一方、論文のレシピでは 410 mM となり、これはかなり高い塩濃度のようです。これで浸透圧は問題にならないのでしょうか?

集めた大腸菌をソニケーション(超音波)で潰す時に、よく 400mM の塩の入ったバッファを入れます。これはその後の(遠心後の)上清を DEAE カラムにパスさせる時に、蛋白質と核酸を離しておいて後者だけをレジンにくっ付けさせて除去するためです(蛋白質はパスさせる)。その時、400mM の塩を大腸菌に注いでも大腸菌が浸透圧で破裂している様子はなさそうですので、おそらく大丈夫なのでしょう。まあ大腸菌に尋ねてみれば、喉が渇いたと言っているはずですが。

なお、硫黄の成分が多いのは効いているかもしれません。昔 MgSO4 の代わりに MgCl2 を入れたために OD600nm が 0.6 までしか上がらず、それがもとで半年近くを棒に振ったことは前述の通りです。

第一リン酸 Na(K)H2PO4 と第二リン酸 Na(K)2HPO4 の比率を考えてみましょう。(第二リン酸)/(第一リン酸)を比べてみると、我々の方法では 2.23 倍(pH 7.1~7.2)なのに対して、論文では 4.70 倍(pH 7.4~7.5)と、第二リン酸の割合が多いです。これは M9 を作った時点で pH がすでに高めに調整されていることを意味します。このように 410mM の濃い緩衝液を作るということと、初期 pH を >7.4 と高めに調整することにより、大腸菌が溢れて pH が少し下がってきても、それが大腸菌にとって致命傷にまでは至らないのでしょう。

以上がこの論文レシピのコツだと思うのですが、著者らはまだ工夫を凝らしているようです。

どうも成長期が終わる頃に IPTG を入れる方が、結果として蛋白質が多く発現されるらしいのです。当然のように、LB/H2O では急成長しますが、それだけ早く頂点に達してしまいます。逆に M9/D2O の低温培養では成長はゆっくりで、長い時間をかけて登っていきます。普通の M9/D2O に [2H]-glucose を 2g/L 入れた場合には、OD=2.0 で早くも成長曲線が鈍り、OD=2.4 までしか登りません(これだけ登れば良いと思いますが)。一方、改良した M9 では pH がより調整されており、OD がもっと上がります。そして、誘導は OD=10 ぐらいでかけた方がよいとのことです。また、温度を 25℃ ぐらいに下げて誘導した方が、大腸菌が順調に育ち最終的な蛋白質の量が多かったそうです。よく IPTG による誘導は、大腸菌の対数増殖期のど真ん中(だいたい OD=0.5 ぐらい)でかけるべきだと教わっていましたので、これはこれで驚きです。しかし、これらの内容は発現させる蛋白質によって変わる可能性も高いですので、各自の蛋白質で少し試してみた方がよいでしょう。

さらに、適応 adaptation が必要とも書かれています。個人的にはこれはあまり寄与していないような気もするのですが。ただし、うちでも大腸菌を植え継いでいく時には、あまり急激に大腸菌密度が薄まり過ぎないように注意しています。LB から M9 へ、また H2O から D2O への適応については、昔はこまめにやっていましたが、だんだん BL21(DE3) が思っていた以上に強いことに気づき、今ではほとんど止めてしまいました。しかし、一応、著者らのプロトコールを記しておきます。

寒天プレート
 ↓ コロニー
LB 軽水 1.0 mL 37 度、3 hr
 ↓ そのうち 200 μL を
LB 重水 2.5 mL 37 度、5 hr
 ↓ 全部を(OD が 0.5~1.0 に達しているはず)
90% M9/10% LB 重水 25 mL 37 度、overnight
 ↓ 全部を(OD が 10 に達しているはず)
M9 重水 250 mL 37 度、8~10 hr
 ↓ 温度を 25 度に下げる(OD が 10 に達しているはず)
0.5 mM IPTG を加えて 25 度、20 hr
 ↓(OD が 20 に達しているはず)
集菌

この植え継ぎ法を見てみますと、軽水のコンタミ率は 200uL/250mL=0.1% 程度、LB 培地成分のコンタミ率は (2.5mL*2)/250mL=2% 程度あることが分かります。おそらく高分子量を TROSY を使って測定していくのが目的であれば、この程度のコンタミは問題とはならないでしょう。しかし、transfer-cross-saturation(TCS)や filter-NOE などを測りたい場合にはできるだけ 1H のコンタミは抑えたいところですので、この植え継ぎ法は改良した方がよいように思います。

最後に心配なことは、大腸菌はよく育ったけれども、それに反比例して大腸菌一匹あたりの発現量は落ちるという現象です。もし、グルコースの量が限られているのであれば、大腸菌は自分の兄弟を複製するのにエネルギーを使うか、あるいは遺伝子組み換えに騙されてたくさんの蛋白質を転写・翻訳してあげるのにエネルギーを使うかのどちらかを選ばざるを得なくなり、このようになることも頷けます。しかし、彼らの結果によると、そうはならなかったそうです。これも培地に 18g/L という十分な量のグルコースが入っているためでしょう。

まあ、いちど試してみることにしましょう。うまく行くのであれば、メチル基特異的標識などにも応用できそうですし。