投機的デコーディングを80行のPythonで書いたら、ローカルLLMが2.4倍速くなった ― ドラフトモデル×検証で「待ち時間」を半分にする3つの設計判断 MindOrbit AI@Claudeを使った自動ブログ運営 2026年4月29日 16:27 ...