最終更新: 2026年6月1日／初出: 2026年6月1日

DeepSeek R1 で社内 AI を月¥0 から運用 — o1 比 1/30 のオープンソース推論モデル、中小企業の Ollama 活用ガイド

Item: DeepSeek R1
Rating: 4.5
Author: AI経営ラボ

評価⭐ 4.5 / 5

提供元DeepSeek (杭州深度求索人工智能基础技術研究有限公司)

カテゴリオープンソース推論 LLM

OpenAI o1 級の推論性能を、API では約 1/30 の価格で、ローカル PC では電気代だけで動かせる。MIT ライセンスの DeepSeek R1 は、中小企業が「自社データを社外に出さずに AI を使う」段取りを現実的にした最初のオープンソース推論モデルです。本稿では API 料金構造、Ollama での導入手順、社内 RAG・コード生成・リサーチ補助での活用シナリオを編集部で検証しました。

この記事のポイント

DeepSeek R1 は MIT ライセンスのオープンソース推論モデル、モデル重みは Ollama 公式ライブラリから無償取得可
API は入力 $0.55 / 出力 $2.19 (1M トークン)、OpenAI o1 ($15 / $60) と比べて約 96% 安い
Ollama で 1.5B (1.1GB) 〜 671B (404GB) の 7 サイズを配布、中小企業の手元 PC でも 7B〜14B なら実用可
AIME 2024 で 79.8%、MATH-500 で 97.3% と公式論文で報告、数学・コードでは o1 と同水準
商用利用・蒸留・改変まで MIT で許諾、社内 RAG / コード生成 / リサーチ補助に侵襲性ゼロで組み込める

編集長の見解 (Mira): DeepSeek R1 の本当の価値は「ベンチマークが o1 並み」という点よりも、「ローカルで動かせる + 商用利用が MIT で許諾されている」 という運用上の自由度にあります。中小企業の情シスにとって、AI ツール導入の最大の障壁は「自社データをクラウドの大規模言語モデル (LLM) に渡してよいか」の社内合意です。R1 をオンプレで回せるなら、その合意プロセス自体を回避できます。API も併用すれば、機密性の低いタスクは低価格 API、機密性の高いタスクはローカルという二段運用が現実解です。

DeepSeek R1 とは

DeepSeek R1 は中国 DeepSeek が 2025 年 1 月に公開した推論特化型の大規模言語モデル (LLM) です。論文 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning で詳細が公開されており、純粋な強化学習 (RL) で推論能力を獲得した点が技術的な特徴です。

最大の特徴は モデル重みが MIT ライセンスで公開されている ことです。中小企業を含む商用利用、社内向け改変、別モデルへの蒸留 (distillation) まで明示的に許諾されており、これは GPT-5 / Claude / Gemini などの主要クラウド LLM では実現できない運用自由度です。

R1 シリーズの構成

DeepSeek R1 は単一のモデルではなく、フルサイズ版と蒸留版で構成されたシリーズです。Ollama 経由で配布されている主要サイズは以下です。

モデル	パラメータ数	ファイルサイズ	コンテキスト	想定環境
deepseek-r1:1.5b	1.5B	1.1GB	128K	ノート PC (M1 MacBook Air でも動く)
deepseek-r1:7b	7B	4.7GB	128K	一般的なゲーミング PC (8GB VRAM 程度)
deepseek-r1:14b	14B	9.0GB	128K	16GB VRAM 程度、中小企業の検証用に推奨
deepseek-r1:32b	32B	20GB	128K	RTX 3090 / 4090 級 (24GB VRAM)
deepseek-r1:70b	70B	43GB	128K	A6000 級 or マルチ GPU
deepseek-r1:671b	671B	404GB	160K	クラウド GPU クラスタ前提

→ 中小企業の最初の検証には 7B または 14B サイズが現実的です。 1.5B はチャットボット用、671B は研究機関向けです。次節では、これらをどの API 価格で使えるかを整理します。

API 料金構造 (o1 比 1/30 の衝撃)

DeepSeek 公式 API の R1 (deepseek-reasoner) は 2026 年現在、以下の単価で提供されています。

項目	単価 (USD/1M トークン)	円換算 (1 USD = 150 円)
入力 (キャッシュミス)	$0.55	¥83
入力 (キャッシュヒット)	$0.055	¥8
出力	$2.19	¥329

DeepSeek 公式料金ページによると、2026 年 4 月 26 日以降、入力キャッシュヒット時の単価は通常価格の 1/10 に引き下げられています。同じプロンプトを繰り返す業務 (定型レポート生成、定型分類) ではキャッシュが効きやすく、実効コストはさらに下がる構造です。

OpenAI o1 との価格比較

観点	DeepSeek R1	OpenAI o1	倍率
入力単価 (1M)	$0.55	$15.00	27 倍差
出力単価 (1M)	$2.19	$60.00	27 倍差
MIT ライセンス	あり	なし (プロプライエタリ)	—
ローカル実行	可 (Ollama 等)	不可	—
編集部の評価	中小企業の常用候補	エンタープライズ専用	—

→ 同じワークロードで OpenAI o1 が月 ¥100,000 かかる用途なら、DeepSeek R1 では ¥3,700 程度 に収まる試算です (VentureBeat の独立検証でも「95% 安い」と報じています)。中小企業の AI 月額予算 ¥10,000 以内で「推論 LLM を常用する」が初めて成立する価格水準です。

編集部の警告: DeepSeek 公式 API では、deepseek-reasoner という API 名は将来的に deepseek-v4-flash の thinking モードへ統合される予定です。API 名を直接コードにハードコードしている場合、移行時の影響を確認してください。本稿執筆時点 (2026 年 6 月) では deepseek-reasoner を呼び出すコードはそのまま動作しますが、本番運用するなら 環境変数やコンフィグでモデル名を外出し する設計が安全です。

中小企業での 3 大活用シナリオ

R1 を「中小企業のどの業務に効くか」という観点で、編集部が現場ヒアリングから整理した代表シナリオを 3 つ示します。

シナリオ 1: 情シス部門の社内 RAG

中堅製造業 (社員 80 名、情シス 2 名) の事例イメージ。「過去の障害対応ログを検索したい」「設計書 PDF から条件に合う設計を引きたい」という需要は中小企業にも普遍的にあります。

しかし社外 LLM に設計書を送ることは社内規程で NG になりがちです。ここで R1 を オンプレ Ollama で動かし、社内ドキュメントを外部知識として参照する仕組み — RAG (外部知識を参照する AI 仕組み、Retrieval-Augmented Generation) — を組めば、データは社内ネットワークから一歩も出ません。

中小規模なら 14B モデル + 16GB VRAM の単一 GPU サーバー (1 台 30〜50 万円程度) で初期構築が可能です。詳細な Ollama 運用は Ollama でローカル LLM を動かす実装ガイドを参照してください。

シナリオ 2: 社内エンジニアのコード生成補助

R1 はコーディング能力が高く、SWE-bench Verified などのコード系ベンチマークでも上位です。社内エンジニアが Aider や Cursor から R1 を呼び出して、レガシーコード保守やテスト生成に使う構成は現実的です。

API なら従量、ローカルなら無料という二択を選べる柔軟性が R1 の強みです。API 連携の詳細は Aider で社内開発を自走化するガイドとコーディング AI 比較ガイドを併せて参照してください。

シナリオ 3: リサーチ補助 (調査・要約)

中小企業の経営者・企画担当が「業界レポート 50 ページの要約」「競合の IR 文書からの数値抽出」を依頼する用途は、推論モデルの得意分野です。R1 は思考プロセス (Chain-of-Thought) を内部で長く回すため、複雑な比較や条件抽出で実用品質を出します。

機密性の低い公開資料の調査なら API、未公開の社内資料が混ざるならローカル、という運用切り替えを情シスが用意しておくと、業務側は「タスクに応じて適切な経路を選ぶ」だけで済みます。

編集部のヒント: 中小企業が R1 を試す最短ルートは「まず Ollama で 7B か 14B を 1 台のノート PC に入れて、社内検索のサンプル質問を 20 個投げてみる」です。導入判断に必要な品質は、この検証だけで十分つかめます。ベンチマーク数値より、自社データに対する手応えで判断するのが現場の鉄則です。

Ollama での導入手順 (5 ステップ)

R1 をローカルで動かす最も簡単な経路が Ollama です。Mac / Linux / Windows いずれにも対応しており、コマンド 2 行で起動できます。

Step 1: Ollama のインストール

公式インストールスクリプト (Mac / Linux):

curl -fsSL https://ollama.com/install.sh | sh

Windows は公式サイトからインストーラをダウンロードしてください。社内ポリシーで外部スクリプトを直接 sh に流せない場合は、ソースを GitHub の公式リポジトリで確認してから手動でビルド・配布する手順を推奨します。

Step 2: モデルサイズの選定

手元の GPU 搭載状況に合わせて選びます。

# 検証用 (ノート PC でも動く軽量版)
ollama pull deepseek-r1:7b

# 中小企業の常用に推奨 (16GB VRAM 程度)
ollama pull deepseek-r1:14b

# RTX 4090 などハイエンド GPU 環境
ollama pull deepseek-r1:32b

Step 3: 動作確認

ollama run deepseek-r1:14b

対話モードが起動し、プロンプトを入力すると応答が返ってきます。初回はモデルのロードに数十秒かかりますが、2 回目以降は即応します。

Step 4: API モードでの起動

業務システムから呼び出すには Ollama を REST API として常駐させます。デフォルトで http://localhost:11434/api/generate がエンドポイントになります。社内サーバーで稼働させる場合は、ファイアウォール経由で社内 LAN からのみアクセス可能に絞る設定を必ず行ってください。

Step 5: 業務システムへの接続

OpenAI API 互換のクライアントライブラリ (例: Python の openai パッケージ、LangChain) は、Ollama を base_url 指定するだけでそのまま使えます。社内 RAG や社内チャットボットに R1 を組み込む工数は、軽い実装なら 1 日〜数日です。

クラウド API か、ローカル実行か — 編集部の判断軸

両者を選ぶ際の判断軸を整理しました。

観点	クラウド API (DeepSeek 公式)	ローカル Ollama
初期コスト	¥0 (API キー発行のみ)	数十万円 (GPU サーバー)
ランニング	従量、月 ¥1,500〜10,000 程度の試算範囲	電気代のみ (月数千円)
機密データ	DeepSeek サーバーに送信される	社内ネットワーク外に出ない
法人契約	中国本土事業者との直接契約	不要
性能上限	フル R1 (671B 相当)	自前ハードのスペックに依存
編集部の評価	機密度低タスクの大量処理向け	機密度高タスク・本格運用向け

→ 中小企業の現実解は両者の併用 です。機密性の低い公開資料の処理は API で安く回し、社内資料を扱うタスクはローカルで完結させる。この二段構えなら、コストと安全性のバランスを業務側のリテラシーに応じて柔軟に取れます。次節では、運用上の注意点を整理します。

運用上の注意点

編集部の警告 (機密データ送信): DeepSeek 公式 API は中国本土事業者が運営しています。日本国内法・社内規程・取引先との契約で「データの海外送信不可」「中国事業者への送信不可」の制約がある業種 (金融・医療・防衛関連の下請けなど) では、API ではなくローカル実行を選択 してください。社内決裁を経ずに API へ機密データを送る運用は、後から法務・コンプライアンス指摘で大きな手戻りになります。

編集部の警告 (蒸留版のライセンス確認): Ollama 配布の R1 のうち、Qwen ベースの蒸留版は Apache 2.0、Llama ベースの蒸留版 (8B / 70B) は Llama 3.1 / 3.3 ライセンスが適用されます。MIT 一律ではない点に注意し、自社で再配布や派生モデル開発を行う場合は モデルごとの個別ライセンス確認 を行ってください。

よくある質問

Q. なぜ「推論モデル」とそうでないモデルを区別するのか? A. R1 や o1 は応答の前に「思考の連鎖 (Chain-of-Thought)」を内部で長く回す設計で、数学・論理・コードのような段階的推論が必要なタスクに強い反面、雑談や定型応答ではトークン消費が大きくコスパが悪くなる傾向があります。社内 FAQ チャットボットなら DeepSeek V4 (非 thinking モード) の方が経済的、というケースもあります。

Q. 14B モデルは GPU なしの CPU 環境で動くか? A. 動きますが応答速度が秒単位で遅くなり、業務利用は厳しいです。実用ラインは GPU 推論で、最低でも 12GB VRAM 程度を編集部としては推奨します。Apple Silicon (M2 Pro 以上 + 32GB ユニファイドメモリ) でも 14B は実用速度で動くという報告があります。

Q. R1 と Claude / GPT-5 / Gemini の使い分けは? A. (1) 日本語の自然な長文ライティングは Claude / GPT-5 が依然優位、(2) 数学・コード・論理推論で安価に大量処理したい場合は R1、(3) 社内データを社外に出したくない要件なら R1 ローカル一択、というのが編集部の現時点の整理です。Claude / GPT 系の詳細は Claude Pro レビューと ChatGPT Plus レビューを参照してください。

Q. 社内導入の最初のステップは何か? A. まず情シス担当が手元のノート PC で ollama run deepseek-r1:7b を試し、社内資料のサンプル質問を 20 個程度投げてみるのが最短です。手応えが得られたら 14B を社内検証 GPU サーバーに乗せ、業務側 1〜2 部門でパイロット運用するという段取りが現実的です。

まとめ

DeepSeek R1 は「o1 並みの推論性能を、1/30 の API 価格、または自前ハードでローカル運用できる」という、中小企業の AI 導入条件を根本から変えた最初のオープンソース推論モデルです。MIT ライセンスの自由度と、Ollama での簡単な導入経路により、月 ¥0 から始めて段階的に拡張する選択肢が現実的です。機密性の高いデータを抱える中小企業ほど、検証する価値の大きいツールと編集部としては評価します。

出典・参考情報

もっと深く学ぶための関連書籍

DeepSeek R1 の真価は API 価格の安さよりも「自社データを社外に出さずローカルで動かせる」運用自由度にあり、Ollama での社内 RAG 構築やモデルサイズ選定を自分で判断できるかが導入成功の鍵になります。ローカル LLM の動かし方と社内 AI 基盤の設計を体系的に学べば、機密度に応じて API とオンプレを使い分ける二段運用を、情シス主導で現実に組み立てられるようになります。

Amazon でローカルLLM 自社AI 構築関連書籍を見る → ※ PR・アフィリエイトリンクを含みます

Mira ／ AI経営ラボ編集長

料金プラン

プラン	料金 (JPY)	請求
ローカル実行 (Ollama 経由、自前ハード)	¥0	月額
API 軽利用 (deepseek-reasoner 互換、中規模利用の編集部試算)	¥1,500	月額
API 中利用 (1 日 200 万トークン程度の編集部試算)	¥9,000	月額

👍 メリット

MIT ライセンスのオープンソース、モデル重みを商用利用・改変・蒸留まで自由に使える
API 単価が OpenAI o1 比で約 1/30、入力 $0.55 / 出力 $2.19 (1M トークン) の低価格
Ollama 経由で 1.5B〜671B の蒸留版を含む 7 サイズが配布、自前 PC でも動かせる
AIME 2024 で 79.8% / MATH-500 で 97.3% など数学・コード系ベンチマークで o1 と同水準
データを社外に出したくない中小企業の社内 RAG・コード支援に「クラウド非依存」で導入可能

👎 デメリット

DeepSeek 公式 API では `deepseek-reasoner` 名称は段階的に deepseek-v4-flash の thinking モードへ統合される予定
中国本土事業者のため、機密データの API 送信は社内ポリシーで NG になる組織もある
ローカル実行で 32B 以上を快適に動かすには 20GB 超の VRAM を持つ GPU が必要
日本語の細部表現は GPT-5 や Claude Sonnet と比べて若干硬く、長文ライティング用途では物足りない場面がある