DeepSeek R1 で社内 AI を月¥0 から運用 — o1 比 1/30 のオープンソース推論モデル、中小企業の Ollama 活用ガイド

DeepSeek R1 のレビュー — AI ツールカテゴリ

AI経営ラボ 評価: ⭐ 4.5 / 5

提供元: DeepSeek (杭州深度求索人工智能基础技術研究有限公司)

カテゴリ: オープンソース推論 LLM

OpenAI o1 級の推論性能を、API では約 1/30 の価格で、ローカル PC では電気代だけで動かせる。MIT ライセンスの DeepSeek R1 は、中小企業が「自社データを社外に出さずに AI を使う」 段取りを現実的にした最初のオープンソース推論モデルです。本稿では API 料金構造、Ollama での導入手順、社内 RAG・コード生成・リサーチ補助での活用シナリオを編集部で検証しました。

この記事のポイント

編集長の見解 (Mira): DeepSeek R1 の本当の価値は「ベンチマークが o1 並み」 という点よりも、「ローカルで動かせる + 商用利用が MIT で許諾されている」 という運用上の自由度にあります。中小企業の情シスにとって、AI ツール導入の最大の障壁は「自社データをクラウドの大規模言語モデル (LLM) に渡してよいか」の社内合意です。R1 をオンプレで回せるなら、その合意プロセス自体を回避できます。API も併用すれば、機密性の低いタスクは低価格 API、機密性の高いタスクはローカルという二段運用が現実解です。

DeepSeek R1 とは

DeepSeek R1 は中国 DeepSeek が 2025 年 1 月に公開した推論特化型の大規模言語モデル (LLM) です。論文 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning で詳細が公開されており、純粋な強化学習 (RL) で推論能力を獲得した点が技術的な特徴です。

最大の特徴は モデル重みが MIT ライセンスで公開されている ことです。中小企業を含む商用利用、社内向け改変、別モデルへの蒸留 (distillation) まで明示的に許諾されており、これは GPT-5 / Claude / Gemini などの主要クラウド LLM では実現できない運用自由度です。

R1 シリーズの構成

DeepSeek R1 は単一のモデルではなく、フルサイズ版と蒸留版で構成されたシリーズです。Ollama 経由で配布されている主要サイズは以下です。

モデルパラメータ数ファイルサイズコンテキスト想定環境
deepseek-r1:1.5b1.5B1.1GB128Kノート PC (M1 MacBook Air でも動く)
deepseek-r1:7b7B4.7GB128K一般的なゲーミング PC (8GB VRAM 程度)
deepseek-r1:14b14B9.0GB128K16GB VRAM 程度、中小企業の検証用に推奨
deepseek-r1:32b32B20GB128KRTX 3090 / 4090 級 (24GB VRAM)
deepseek-r1:70b70B43GB128KA6000 級 or マルチ GPU
deepseek-r1:671b671B404GB160Kクラウド GPU クラスタ前提

中小企業の最初の検証には 7B または 14B サイズが現実的です。 1.5B はチャットボット用、671B は研究機関向けです。次節では、これらをどの API 価格で使えるかを整理します。

API 料金構造 (o1 比 1/30 の衝撃)

DeepSeek 公式 API の R1 (deepseek-reasoner) は 2026 年現在、以下の単価で提供されています。

項目単価 (USD/1M トークン)円換算 (1 USD = 150 円)
入力 (キャッシュミス)$0.55¥83
入力 (キャッシュヒット)$0.055¥8
出力$2.19¥329

DeepSeek 公式料金ページ によると、2026 年 4 月 26 日以降、入力キャッシュヒット時の単価は通常価格の 1/10 に引き下げられています。同じプロンプトを繰り返す業務 (定型レポート生成、定型分類) ではキャッシュが効きやすく、実効コストはさらに下がる構造です。

OpenAI o1 との価格比較

観点DeepSeek R1OpenAI o1倍率
入力単価 (1M)$0.55$15.0027 倍差
出力単価 (1M)$2.19$60.0027 倍差
MIT ライセンスありなし (プロプライエタリ)
ローカル実行可 (Ollama 等)不可
編集部の評価中小企業の常用候補エンタープライズ専用

→ 同じワークロードで OpenAI o1 が月 ¥100,000 かかる用途なら、DeepSeek R1 では ¥3,700 程度 に収まる試算です (VentureBeat の独立検証 でも「95% 安い」 と報じています)。中小企業の AI 月額予算 ¥10,000 以内で「推論 LLM を常用する」 が初めて成立する価格水準です。

編集部の警告: DeepSeek 公式 API では、deepseek-reasoner という API 名は将来的に deepseek-v4-flash の thinking モードへ統合される予定です。API 名を直接コードにハードコードしている場合、移行時の影響を確認してください。本稿執筆時点 (2026 年 6 月) では deepseek-reasoner を呼び出すコードはそのまま動作しますが、本番運用するなら 環境変数やコンフィグでモデル名を外出し する設計が安全です。

中小企業での 3 大活用シナリオ

R1 を「中小企業のどの業務に効くか」 という観点で、編集部が現場ヒアリングから整理した代表シナリオを 3 つ示します。

シナリオ 1: 情シス部門の社内 RAG

中堅製造業 (社員 80 名、情シス 2 名) の事例イメージ。「過去の障害対応ログを検索したい」「設計書 PDF から条件に合う設計を引きたい」 という需要は中小企業にも普遍的にあります。

しかし社外 LLM に設計書を送ることは社内規程で NG になりがちです。ここで R1 を オンプレ Ollama で動かし、社内ドキュメントを外部知識として参照する仕組み — RAG (外部知識を参照する AI 仕組み、Retrieval-Augmented Generation) — を組めば、データは社内ネットワークから一歩も出ません。

中小規模なら 14B モデル + 16GB VRAM の単一 GPU サーバー (1 台 30〜50 万円程度) で初期構築が可能です。詳細な Ollama 運用は Ollama でローカル LLM を動かす実装ガイド を参照してください。

シナリオ 2: 社内エンジニアのコード生成補助

R1 はコーディング能力が高く、SWE-bench Verified などのコード系ベンチマークでも上位です。社内エンジニアが Aider や Cursor から R1 を呼び出して、レガシーコード保守やテスト生成に使う構成は現実的です。

API なら従量、ローカルなら無料という二択を選べる柔軟性が R1 の強みです。API 連携の詳細は Aider で社内開発を自走化するガイドコーディング AI 比較ガイド を併せて参照してください。

シナリオ 3: リサーチ補助 (調査・要約)

中小企業の経営者・企画担当が「業界レポート 50 ページの要約」「競合の IR 文書からの数値抽出」 を依頼する用途は、推論モデルの得意分野です。R1 は思考プロセス (Chain-of-Thought) を内部で長く回すため、複雑な比較や条件抽出で実用品質を出します。

機密性の低い公開資料の調査なら API、未公開の社内資料が混ざるならローカル、という運用切り替えを情シスが用意しておくと、業務側は「タスクに応じて適切な経路を選ぶ」 だけで済みます。

編集部のヒント: 中小企業が R1 を試す最短ルートは「まず Ollama で 7B か 14B を 1 台のノート PC に入れて、社内検索のサンプル質問を 20 個投げてみる」 です。導入判断に必要な品質は、この検証だけで十分つかめます。ベンチマーク数値より、自社データに対する手応えで判断するのが現場の鉄則です。

Ollama での導入手順 (5 ステップ)

R1 をローカルで動かす最も簡単な経路が Ollama です。Mac / Linux / Windows いずれにも対応しており、コマンド 2 行で起動できます。

Step 1: Ollama のインストール

公式インストールスクリプト (Mac / Linux):

curl -fsSL https://ollama.com/install.sh | sh

Windows は 公式サイト からインストーラをダウンロードしてください。社内ポリシーで外部スクリプトを直接 sh に流せない場合は、ソースを GitHub の公式リポジトリで確認してから手動でビルド・配布する手順を推奨します。

Step 2: モデルサイズの選定

手元の GPU 搭載状況に合わせて選びます。

# 検証用 (ノート PC でも動く軽量版)
ollama pull deepseek-r1:7b

# 中小企業の常用に推奨 (16GB VRAM 程度)
ollama pull deepseek-r1:14b

# RTX 4090 などハイエンド GPU 環境
ollama pull deepseek-r1:32b

Step 3: 動作確認

ollama run deepseek-r1:14b

対話モードが起動し、プロンプトを入力すると応答が返ってきます。初回はモデルのロードに数十秒かかりますが、2 回目以降は即応します。

Step 4: API モードでの起動

業務システムから呼び出すには Ollama を REST API として常駐させます。デフォルトで http://localhost:11434/api/generate がエンドポイントになります。社内サーバーで稼働させる場合は、ファイアウォール経由で社内 LAN からのみアクセス可能に絞る設定を必ず行ってください。

Step 5: 業務システムへの接続

OpenAI API 互換のクライアントライブラリ (例: Python の openai パッケージ、LangChain) は、Ollama を base_url 指定するだけでそのまま使えます。社内 RAG や社内チャットボットに R1 を組み込む工数は、軽い実装なら 1 日〜数日です。

クラウド API か、ローカル実行か — 編集部の判断軸

両者を選ぶ際の判断軸を整理しました。

観点クラウド API (DeepSeek 公式)ローカル Ollama
初期コスト¥0 (API キー発行のみ)数十万円 (GPU サーバー)
ランニング従量、月 ¥1,500〜10,000 程度の試算範囲電気代のみ (月数千円)
機密データDeepSeek サーバーに送信される社内ネットワーク外に出ない
法人契約中国本土事業者との直接契約不要
性能上限フル R1 (671B 相当)自前ハードのスペックに依存
編集部の評価機密度低タスクの大量処理向け機密度高タスク・本格運用向け

中小企業の現実解は両者の併用 です。機密性の低い公開資料の処理は API で安く回し、社内資料を扱うタスクはローカルで完結させる。この二段構えなら、コストと安全性のバランスを業務側のリテラシーに応じて柔軟に取れます。次節では、運用上の注意点を整理します。

運用上の注意点

編集部の警告 (機密データ送信): DeepSeek 公式 API は中国本土事業者が運営しています。日本国内法・社内規程・取引先との契約で「データの海外送信不可」「中国事業者への送信不可」 の制約がある業種 (金融・医療・防衛関連の下請けなど) では、API ではなくローカル実行を選択 してください。社内決裁を経ずに API へ機密データを送る運用は、後から法務・コンプライアンス指摘で大きな手戻りになります。

編集部の警告 (蒸留版のライセンス確認): Ollama 配布の R1 のうち、Qwen ベースの蒸留版は Apache 2.0、Llama ベースの蒸留版 (8B / 70B) は Llama 3.1 / 3.3 ライセンスが適用されます。MIT 一律ではない点に注意し、自社で再配布や派生モデル開発を行う場合は モデルごとの個別ライセンス確認 を行ってください。

よくある質問

Q. なぜ「推論モデル」 とそうでないモデルを区別するのか? A. R1 や o1 は応答の前に「思考の連鎖 (Chain-of-Thought)」 を内部で長く回す設計で、数学・論理・コードのような段階的推論が必要なタスクに強い反面、雑談や定型応答ではトークン消費が大きくコスパが悪くなる傾向があります。社内 FAQ チャットボットなら DeepSeek V4 (非 thinking モード) の方が経済的、というケースもあります。

Q. 14B モデルは GPU なしの CPU 環境で動くか? A. 動きますが応答速度が秒単位で遅くなり、業務利用は厳しいです。実用ラインは GPU 推論で、最低でも 12GB VRAM 程度を編集部としては推奨します。Apple Silicon (M2 Pro 以上 + 32GB ユニファイドメモリ) でも 14B は実用速度で動くという報告があります。

Q. R1 と Claude / GPT-5 / Gemini の使い分けは? A. (1) 日本語の自然な長文ライティングは Claude / GPT-5 が依然優位、(2) 数学・コード・論理推論で安価に大量処理したい場合は R1、(3) 社内データを社外に出したくない要件なら R1 ローカル一択、というのが編集部の現時点の整理です。Claude / GPT 系の詳細は Claude Pro レビューChatGPT Plus レビュー を参照してください。

Q. 社内導入の最初のステップは何か? A. まず情シス担当が手元のノート PC で ollama run deepseek-r1:7b を試し、社内資料のサンプル質問を 20 個程度投げてみるのが最短です。手応えが得られたら 14B を社内検証 GPU サーバーに乗せ、業務側 1〜2 部門でパイロット運用するという段取りが現実的です。

まとめ

DeepSeek R1 は「o1 並みの推論性能を、1/30 の API 価格、または自前ハードでローカル運用できる」 という、中小企業の AI 導入条件を根本から変えた最初のオープンソース推論モデルです。MIT ライセンスの自由度と、Ollama での簡単な導入経路により、月 ¥0 から始めて段階的に拡張する選択肢が現実的です。機密性の高いデータを抱える中小企業ほど、検証する価値の大きいツールと編集部としては評価します。

出典・参考情報

関連リンク

もっと深く学ぶための関連書籍

DeepSeek R1 の真価は API 価格の安さよりも「自社データを社外に出さずローカルで動かせる」運用自由度にあり、Ollama での社内 RAG 構築やモデルサイズ選定を自分で判断できるかが導入成功の鍵になります。ローカル LLM の動かし方と社内 AI 基盤の設計を体系的に学べば、機密度に応じて API とオンプレを使い分ける二段運用を、情シス主導で現実に組み立てられるようになります。

Amazon で ローカルLLM 自社AI 構築 関連書籍を見る →
※ アフィリエイトリンクを含みます


Mira / AI経営ラボ 編集長

料金プラン

プラン 料金 (JPY) 請求
ローカル実行 (Ollama 経由、自前ハード) ¥0 月額
API 軽利用 (deepseek-reasoner 互換、中規模利用の編集部試算) ¥1,500 月額
API 中利用 (1 日 200 万トークン程度の編集部試算) ¥9,000 月額

👍 メリット

👎 デメリット


Mira / AI経営ラボ 編集長

最終更新: 2026年6月1日 / 初出: 2026年6月1日