こんな方におすすめ
- キーボードで長文を打つのがつらい。声で言いたいことがある
- AIとの壁打ちを音声でリズミカルに行いたい
- メールやチャットの返信を、音声でさっと済ませたい
- 音声や入力データはクラウドに送りたくない
オフライン対応版。入力データが外部に送信されることはありません。
完全ローカル完結でAI音声入力・推敲ができるMac向け無料アプリです。v1.2.0 より MIT ライセンスでオープンソース公開。
推敲後のテキストがここに表示されます
新しいサービスのランディングページについて壁打ちしたいです。 想定ターゲットと課題を整理し、ファーストビューの見出し案と全体構成案を提案してください。
v1.2.0より、VoiceKun を MIT ライセンスでオープンソース公開しました。
voicekun.dmg·約 10.7 MB
対応環境:Apple Silicon(M1 以降)の Mac
バージョン:v1.2.0
更新日: 2026年6月20日
VoiceKun のソースコードは GitHub で公開しています。MIT ライセンスのもと、閲覧・ビルド・改変・再配布が可能です。
上のダウンロードボタンは AHREF が配布する公証済み DMG です。ソースから自分でビルドする場合は、macOS 14 以降・Xcode・XcodeGen が必要です(詳細はリポジトリの README を参照)。
VoiceKun の公開バージョンの履歴です。
ダウンロードとインストール
上のダウンロードから DMG を保存し、ダブルクリックで開きます。中にある VoiceKun を「アプリケーション」フォルダへドラッグして配置してください。
アクセス制御の設定
アプリを起動し、設定の権限タブの案内に従います。マイク・音声認識・アクセシビリティ・入力監視など、macOS の「プライバシーとセキュリティ」で VoiceKun を許可してください。各項目の意味はMac から求められる許可をご覧ください。
AI モデルのダウンロード
設定 › AI 推敲でモデルを選び「ダウンロード」します。おすすめは Gemma 4と Qwen 3.5 4Bです。
利用イメージ
操作
2回押す
音声入力を開始
もう一度2回押す
確定処理へ進む
入力欄
fn キーとコマンドキー(⌘)を同時に押している間だけ音声入力になります。キーを離すと確定処理に進みます。
利用イメージ
操作
fn + ⌘ を同時に押す
離すと確定処理へ進みます。
入力欄
話すだけで文字入力
AIプロンプト入力、メール、Slack、メモ、ブラウザの入力欄など、カーソルがある場所に音声で入力できます。
ショートカットで音声入力
キーを押して話す/離すと止める、など好みの操作に設定できます。
辞書機能で補正
固有名詞や社内用語の補正辞書で認識しやすくしたり、決まった言い回しに置き換えたりできます。
アプリ内から AI モデルを入手可能
複数の AI モデルをアプリ内でダウンロードして選べます。おすすめは Gemma 4 と Qwen 3.5 4B です(Apple シリコン搭載 Mac が対象)。詳しくはAIモデルについてをご覧ください。
セキュリティを重視する環境でも安心して使えるよう、VoiceKun は外部通信を行わないローカル完結型にこだわっています。
音声認識・AI 推敲・チャットはすべて Mac 内で完結します。クラウドの生成 AI へデータが送られることはありません。
初回ダウンロード後は、ネットワークから独立して動作します。
アプリ利用のため macOS の「音声入力」をオンにする必要があります。設定画面の「Apple に送信」という表記は、Apple の改善プログラム(任意)に関する説明であり、VoiceKun が音声を送信することはありません。
| 項目 | 詳細 |
|---|---|
| マイク | 話し声を録音・入力に用いるため、プライバシーでマイクの利用を許可する必要があります。 |
| 音声認識 | オンデバイスで声をテキストに変換するため、音声認識の権限が必要です。 |
| アクセシビリティ | 他アプリの入力欄へ確定テキストを送るためアクセシビリティ権限が必要です。これにより前面アプリへテキストが挿入できます。 |
| 入力監視 | 一部のグローバルホットキーがキーイベントの監視を要します。ホットキーの種類により必要になります。 |
| キーボード音声入力(Dictation) | VoiceKun の音声認識は Apple の Speech フレームワークの SFSpeechRecognizerを用い、requiresOnDeviceRecognitionによるオンデバイス認識を利用します。 |
一度「許可しない」を選ぶと、アプリの画面だけでは直せません。システム設定の「プライバシーとセキュリティ」から、該当する項目を開き直してください。
すでにホットキーが登録されているアプリがある場合は、キー割り当てが競合している場合があります。アクセシビリティや入力監視に該当しそうなソフトがないか確認してください。
バージョンアップの際は、古いバージョンが権限一覧に表示されている場合があります。その場合はON,OFFではなく、一度削除してから、新しいバージョンを登録しなおしてください。
VoiceKun は、以下の AI モデルから選択できます。モデル取得は Hugging Face から行われます。
おすすめは Gemma 4と Qwen 3.5 4Bです。
| モデル | 生成元 | 特徴 | DLサイズ |
|---|---|---|---|
Gemma 4 E2B IT Q4_K_Mおすすめ | 約20億パラメータの超軽量モデル。128Kの長コンテキスト対応で、低遅延・省メモリ運用に最適(※VoiceKunではテキスト機能のみ利用)。 | 約 3.2 GB | |
Qwen3.5 4B Instruct Q4_K_Mおすすめ | Alibaba | 40億パラメータの密(dense)モデル。201言語対応・長コンテキストで、小型ながら高い指示追従性能と言語能力を誇る。 | 約 2.5 GB |
Phi-3 Mini 4k Instruct Q4 | Microsoft | 約38億パラメータの軽量モデル。4Kコンテキストと小規模ながら、高い推論・指示追従性能を持つ(省メモリ向け)。 | 約 2.1 GB |
Mistral 7B Instruct v0.3 Q4_K_M | Mistral AI | 70億パラメータの汎用モデル。32Kコンテキストに対応し、自然な会話や的確な指示追従に定評がある。 | 約 4.1 GB |
Llama 3 8B Japanese Instruct Q4_K_M | Meta | Meta Llama 3 8B Instructをベースに、日本語会話データで追加調整した派生モデル。日本語の表現力や推敲品質を最重視する場合に最適。 | 約 4.6 GB |
設定 › AI 推敲 でモデルを選び「ダウンロード」してください。
Hugging Faceは、世界中の開発者が最新のAIモデルを公開・配布している、世界最大のAIライブラリです。
特徴欄は Google(Gemma 4)、Alibaba(Qwen3.5)、Microsoft(Phi-3)、Mistral AI、Meta(Llama 3)の公開ドキュメント・モデルカードに基づく要約です。VoiceKun で配布するのはいずれも Q4 系 GGUF です。