OpenSCAD での AI コーディングツール 6 種類をベンチマーク—パンテオン構築タスク

ModelRift は、AI コーディングツール 6 種類が OpenSCAD でパンテオン 3D モデルを構築する能力を評価するベンチマークテストを実施しました。Google Antigravity 2.0 / Gemini 3.5 Flash High が最高スコアを獲得し、実際のパンテオン寸法と内部格間天井パターンを実装しました。

ModelRift は、AI コーディングツールが建築参照資料をパラメトリック CAD コードに変換する能力を評価するため、6 つのシステムにパンテオン構築タスクを与えるベンチマークテストを実施しました。各システムは参照画像と OpenSCAD CLI ツールを使用してモデルをレンダリング・反復改善することで、空間幾何学理解と CAD コード生成スキルを検証されました。

ベンチマークのセットアップと方法

ModelRift は、参照画像 2 枚を基に「openscad implementation of pantheon」を構築し、「openscad CLI (available) to preview your work (by rendering openscad model to .png) and iterate until you are happy with the result」という指示を与えました。対象となった 6 つのシステムは Cursor、Claude Code、Google Antigravity、Codex、Google Gemini、ModelRift 自身で、すべてが有効で描画可能な OpenSCAD コードを生成しました。

パンテオンの参照イメージ

各システムのスコアと結果

ベンチマーク結果では、品質スコアと速度スコアで以下の順位が記録されました。

システム	品質スコア	速度スコア
Cursor 3.5 / Composer 2.5	5	1.4
Codex 5.5 High	4	3.0
Google Antigravity 2.0 / Gemini 3.5 Flash High	4.5	1
Claude Code 2.1 / Opus 4.7	2	3.0
Claude Code 2.1 / Sonnet 4.6	1	3.4
ModelRift / Gemini Flash 3.0	3.8	1

Google Antigravity 2.0 / Gemini 3.5 Flash High は自律型エージェントの中で最高の結果を達成しました。参照画像を目視するのみでなく、実際のパンテオン寸法を検索し、「M AGRIPPA L F COS TERTIVM FECIT」の銘文を含めたほか、唯一内部の格間天井パターン（5 リング、各 28 個の格）を実装しました。一方、Codex 5.5 High はエンタブレチュア部分に同様のテキストを含めましたが、ポルティコ屋根周辺でジオメトリの問題が発生し、プレビュー時の表示と最終エクスポートメッシュが異なりました。

モデル概要スコア

実装上の特性

ModelRift / Gemini Flash 3.0 は約 10 分で完了し、Google Antigravity は約 12 分（速度スコア 1）かかりました。Claude Code と比較すると、ModelRift / Gemini Flash 3.0 ワークフロー時間は 2x でした。最速実行は Cursor でしたが、品質は最も低い結果を生み出しました。Claude Sonnet は自律型バッチの中で最もクリーンなモデルを生成しました。

Google Gemini API の価格設定は 5 月 19 日に発表された Gemini 3.5 Flash で 1M 入力トークンあたり $1.50、1M 出力トークンあたり $9.00 です。これは前世代の Gemini 3 Flash（入力 $0.50、出力 $3.00）と比較して 3x のコスト増加です。

この記事は元記事の事実のみに基づいて自動生成されました。

筆者の見立て

OpenSCAD はブール演算、放射状対称性、押し出し、清潔な建設的な図形により優れているため、パンテオンはベンチマークとしてより有用な中間的な難易度にあると解釈している
3D アプリケーションを UI アクション経由で操作させるのではなく、OpenSCAD により LLM はジオメトリについてより自然に推論できると考えている
パンテオンは認識しやすいため、品質が低い結果でも薄く円形建造物に見えるが、より良い結果は建築部分間の関係をおおよそ正しく把握する必要があると解釈している
OpenSCAD はジオメトリ自体を成果物として保持するため、Blender MCP や同様のツール制御アプローチより複雑なジオメトリに対してより重要であると解釈している
Flash 3.5 は計画・レンダリング・検査・修正ができるツールと組み合わせた場合、空間コード生成について非常に有望に見えると考える
完全自律型生成はこの種のタスクにはまだ適切なワークフローではないと考える
空間幾何学について、第 1 層のモデルでも Annotation Mode による人間参加ステップが重要であると解釈している

出典

ModelRift — OpenSCAD code editor & AI 3D model builder「OpenSCAD LLM Benchmark: Building the Pantheon | ModelRift Blog」https://modelrift.com/blog/openscad-llm-benchmark/

OpenSCAD での AI コーディング ツール 6 種類をベンチマーク—パンテオン構築タスク

ベンチマークのセットアップと方法

各システムのスコアと結果

実装上の特性

筆者の見立て

出典

この記事をシェア

OpenSCAD での AI コーディングツール 6 種類をベンチマーク—パンテオン構築タスク