VoiceKun｜Mac 向け音声入力・ローカル AI 推敲アプリ（ダウンロード）

ダウンロード

v1.2.0より、VoiceKun を MIT ライセンスでオープンソース公開しました。

VoiceKun をダウンロード

voicekun.dmg·約 10.7 MB

対応環境：Apple Silicon（M1 以降）の Mac

バージョン：v1.2.0

更新日： 2026年6月20日

オープンソース

VoiceKun のソースコードは GitHub で公開しています。MIT ライセンスのもと、閲覧・ビルド・改変・再配布が可能です。

ahref-org/voicekun— ソースコードリポジトリ
v1.2.0 リリースノート— オープンソース初回公開版
CONTRIBUTING.md— ビルド手順・開発への参加方法

上のダウンロードボタンは AHREF が配布する公証済み DMG です。ソースから自分でビルドする場合は、macOS 14 以降・Xcode・XcodeGen が必要です（詳細はリポジトリの README を参照）。

バージョンアップ履歴

VoiceKun の公開バージョンの履歴です。

v1.2.0最新2026年6月20日
- MIT ライセンスでオープンソース公開（GitHub: ahref-org/voicekun）
- オンデバイス音声認識とローカル LLM による AI 推敲
- ソースからのビルド手順・配布スクリプトを公開
v1.1.02026年5月19日
- 音声効果音機能を追加
v1.0.02026年5月10日
- リリース

インストール手順（かんたん 3 ステップ）

ダウンロードとインストール
上のダウンロードから DMG を保存し、ダブルクリックで開きます。中にある VoiceKun を「アプリケーション」フォルダへドラッグして配置してください。
アクセス制御の設定
アプリを起動し、設定の権限タブの案内に従います。マイク・音声認識・アクセシビリティ・入力監視など、macOS の「プライバシーとセキュリティ」で VoiceKun を許可してください。各項目の意味はMac から求められる許可をご覧ください。
AI モデルのダウンロード
設定 › AI 推敲でモデルを選び「ダウンロード」します。おすすめは Gemma 4と Qwen 3.5 4Bです。

使い方

トグル方式（コマンドキーを2回押して入力開始）

入力したいエリアにカーソルを置き、コマンドキー（⌘）を2回押すと、音声入力が開始されます。
画面下部に「入力中」のステータスが表示されます。
音声入力が終わったら、再度コマンドキーを2回押すと確定処理（AI推敲など）に進みます。

利用イメージ

操作

⌘×2

2回押す

音声入力を開始

⌘×2

もう一度2回押す

確定処理へ進む

入力欄

ここに音声入力されたテキストが入ります

ホールド方式（プッシュ・トゥ・トーク）

fn キーとコマンドキー（⌘）を同時に押している間だけ音声入力になります。キーを離すと確定処理に進みます。

利用イメージ

操作

fn

⌘

fn + ⌘ を同時に押す

離すと確定処理へ進みます。

入力欄

ここに音声入力されたテキストが入ります

VoiceKunでできること

話すだけで文字入力
AIプロンプト入力、メール、Slack、メモ、ブラウザの入力欄など、カーソルがある場所に音声で入力できます。
ショートカットで音声入力
キーを押して話す／離すと止める、など好みの操作に設定できます。
辞書機能で補正
固有名詞や社内用語の補正辞書で認識しやすくしたり、決まった言い回しに置き換えたりできます。
アプリ内から AI モデルを入手可能
複数の AI モデルをアプリ内でダウンロードして選べます。おすすめは Gemma 4 と Qwen 3.5 4B です（Apple シリコン搭載 Mac が対象）。詳しくはAIモデルについてをご覧ください。

プライバシーとセキュリティ：100%ローカル駆動

セキュリティを重視する環境でも安心して使えるよう、VoiceKun は外部通信を行わないローカル完結型にこだわっています。

安心のオンデバイス処理

音声認識・AI 推敲・チャットはすべて Mac 内で完結します。クラウドの生成 AI へデータが送られることはありません。

AI モデルもローカル配置

初回ダウンロード後は、ネットワークから独立して動作します。

macOS 設定に関するご注意

アプリ利用のため macOS の「音声入力」をオンにする必要があります。設定画面の「Apple に送信」という表記は、Apple の改善プログラム（任意）に関する説明であり、VoiceKun が音声を送信することはありません。

Mac から求められる許可について

項目	詳細
マイク	話し声を録音・入力に用いるため、プライバシーでマイクの利用を許可する必要があります。
音声認識	オンデバイスで声をテキストに変換するため、音声認識の権限が必要です。
アクセシビリティ	他アプリの入力欄へ確定テキストを送るためアクセシビリティ権限が必要です。これにより前面アプリへテキストが挿入できます。
入力監視	一部のグローバルホットキーがキーイベントの監視を要します。ホットキーの種類により必要になります。
キーボード音声入力（Dictation）	VoiceKun の音声認識は Apple の Speech フレームワークの `SFSpeechRecognizer`を用い、`requiresOnDeviceRecognition`によるオンデバイス認識を利用します。

一度「許可しない」を選ぶと、アプリの画面だけでは直せません。システム設定の「プライバシーとセキュリティ」から、該当する項目を開き直してください。

すでにホットキーが登録されているアプリがある場合は、キー割り当てが競合している場合があります。アクセシビリティや入力監視に該当しそうなソフトがないか確認してください。

バージョンアップの際は、古いバージョンが権限一覧に表示されている場合があります。その場合はON,OFFではなく、一度削除してから、新しいバージョンを登録しなおしてください。

AIモデルについて

VoiceKun は、以下の AI モデルから選択できます。モデル取得は Hugging Face から行われます。

おすすめは Gemma 4と Qwen 3.5 4Bです。

モデル	生成元	特徴	DLサイズ
Gemma 4 E2B IT Q4_K_Mおすすめ	Google	約20億パラメータの超軽量モデル。128Kの長コンテキスト対応で、低遅延・省メモリ運用に最適（※VoiceKunではテキスト機能のみ利用）。	約 3.2 GB
Qwen3.5 4B Instruct Q4_K_Mおすすめ	Alibaba	40億パラメータの密（dense）モデル。201言語対応・長コンテキストで、小型ながら高い指示追従性能と言語能力を誇る。	約 2.5 GB
Phi-3 Mini 4k Instruct Q4	Microsoft	約38億パラメータの軽量モデル。4Kコンテキストと小規模ながら、高い推論・指示追従性能を持つ（省メモリ向け）。	約 2.1 GB
Mistral 7B Instruct v0.3 Q4_K_M	Mistral AI	70億パラメータの汎用モデル。32Kコンテキストに対応し、自然な会話や的確な指示追従に定評がある。	約 4.1 GB
Llama 3 8B Japanese Instruct Q4_K_M	Meta	Meta Llama 3 8B Instructをベースに、日本語会話データで追加調整した派生モデル。日本語の表現力や推敲品質を最重視する場合に最適。	約 4.6 GB

設定 › AI 推敲でモデルを選び「ダウンロード」してください。

Hugging Faceは、世界中の開発者が最新のAIモデルを公開・配布している、世界最大のAIライブラリです。

特徴欄は Google（Gemma 4）、Alibaba（Qwen3.5）、Microsoft（Phi-3）、Mistral AI、Meta（Llama 3）の公開ドキュメント・モデルカードに基づく要約です。VoiceKun で配布するのはいずれも Q4 系 GGUF です。

AI音声入力アプリ（VoiceKun）

こんな方におすすめ

音声入力とAI推敲の流れ

ダウンロード

オープンソース

バージョンアップ履歴

インストール手順（かんたん 3 ステップ）

使い方

トグル方式（コマンドキーを2回押して入力開始）

ホールド方式（プッシュ・トゥ・トーク）

VoiceKunでできること

プライバシーとセキュリティ：100%ローカル駆動

安心のオンデバイス処理

AI モデルもローカル配置

macOS 設定に関するご注意

Mac から求められる許可について

AIモデルについて

よくあるご質問

こんな方におすすめ

音声入力とAI推敲の流れ

ダウンロード

オープンソース

バージョンアップ履歴

インストール手順（かんたん 3 ステップ）

使い方

トグル方式（コマンドキーを2回押して入力開始）

ホールド方式（プッシュ・トゥ・トーク）

VoiceKunでできること

プライバシーとセキュリティ：100%ローカル駆動

安心のオンデバイス処理

AI モデルもローカル配置

macOS 設定に関するご注意

Mac から求められる許可について

AIモデルについて

よくあるご質問

アプリを起動したのに なにも起こらない/Dock に出てこない

文字が入力されない

音声入力はできるが、確定時にフリーズする

Intel Mac ではAI推敲は使えませんか？

推敲のとき、文章はクラウドに送られますか？