
主な機能
ファイル変換
PDF、PowerPoint、Word、Excel、画像(EXIF・OCR)、音声(EXIF・音声文字起こし)、HTML、CSV/JSON/XML、ZIP、YouTube URL、EPUB等の各種ファイルをMarkdownに変換します。出力はLLMやテキスト解析向けの構造を保持したMarkdown形式です。
プラグイン拡張
サードパーティ製プラグインをサポートしており、インストール済みプラグインの一覧表示や有効化オプションが利用可能です。開発用のサンプルプラグインも提供されています。
API連携
MCP(Model Context Protocol)サーバーを通じてLLMアプリケーションと統合でき、Python向けのMarkItDownクラスなどのプログラム的な利用APIが提供されています。
ファイル操作
コマンドラインツールとしてファイルを直接指定してMarkdownに変換でき、出力ファイル指定(-o)やパイプ入力にも対応します。CLI経由で標準出力へリダイレクトする利用方法が記載されています。
外部サービス連携
Azure Document Intelligenceなどの外部ドキュメント解析サービスと連携して変換を行う機能が提供されています。YouTubeの字幕取得や音声文字起こし用のオプション依存関係も用意されています。
使用例
📄ドキュメント変換
“このPDFをMarkdownに変換して、章ごとに見出しを付けた形式で出力して。重要な箇所を3つ抜き出してほしい。”
🖼️画像のOCRとメタデータ抽出
“この画像をOCRして本文をMarkdownで出力し、EXIFメタデータ(撮影日時・カメラ情報など)も一覧で教えてください。”
🎧音声の文字起こし
“この音声ファイル(mp3)を文字起こしして、発言者分けとタイムスタンプ付きでMarkdownにして下さい。”
📦バッチ変換(ZIPなど)
“このZIPをアップロードしました。中にある全ファイルを順番にMarkdownに変換して、ファイル名ごとにセクションを作ってまとめてください。”
🔌プラグイン/外部サービス連携
“Azure Document Intelligenceを使ってこの複雑なPDFを高精度でMarkdown化して、その後要点を3つにまとめてください。”
導入方法
詳細なインストール方法はGitHubリポジトリのREADMEを参照してください。