今回は、今話題のdeepseekの情報漏えいの話題です。ITに関して最新ニュースを送信してくれる、ITメディアエンタープライズというブログがあります。ここからの引用です。 https://www.itmedia.co.jp/enterprise/
最新ITの情報からセキュリティーまで網羅しているので役立ちます。
機密情報100万件漏えいの可能性――認証なしのDB公開が原因
要約すると以下の内容です。
DeepSeekはAI推論モデル「DeepSeek-R1」を開発している中国のAI企業です。
2025年1月30日、セキュリティ企業Wizは中国のAI企業DeepSeekのデータベースが無防備な状態で公開されていたことを発見しました。問題のデータベースは「ClickHouse」で、認証なしでアクセス可能な状態でした。
漏えいした可能性のある情報には:
- 100万行以上のログストリーム
- チャット履歴
- 秘密キー
- バックエンドの詳細情報
- その他の機密情報
データベースはoauth2callback.deepseek.comとdev.deepseek.comでホストされており、認証なしで任意のSQLクエリを実行できる状態でした。
この事例は、AIアプリケーションの脆弱性が必ずしもAIモデル自体ではなく、基盤となるインフラストラクチャの管理ミスから生じる可能性があることを示しています。
DeepSeekの情報漏洩事件の概要
セキュリティ企業Wizの研究チームであるWiz Researchは、DeepSeekが運用するClickHouseデータベースが認証なしでアクセス可能な状態にあったことを発見しました。 このデータベースは oauth2callback.deepseek.com および dev.deepseek.com でホストされており、それぞれ8123および9000のポートが開放されていました。 外部からの認証が不要だったため、攻撃者がデータベースを完全に制御できる状態でした。
Wiz ResearchはこれらのポートがClickHouseのデータベースに直接接続されており、認証なしで任意のSQLクエリを実行できることを確認しました。例えば、「SHOW TABLES;」というシンプルなコマンドを実行するだけで全てのテーブル情報を取得できたと報告しています。
ClickHouseデータベースとは
ClickHouseの特徴
オープンソースで無料で使用できるデータベースです。
- 列指向データベース: データを列単位で保存することにより、分析クエリに必要なデータのみを読み込むため、高速な処理が可能です。
- 高いクエリパフォーマンス: ベクトル化処理や並列処理などの技術により、高速なクエリ処理を実現しています。
- SQLサポート: 標準的なSQLをサポートしており、既存のSQLスキルを活用可能です。
- スケーラビリティ: 分散処理に対応しており、大量データの処理にも対応可能です。
セキュリティの脆弱性
今回の情報漏洩の原因は、DeepSeekのClickHouseデータベースが認証なしでアクセス可能な状態であったことです。これは、データベースの設定ミス、あるいはセキュリティ対策の不備が原因と考えられます。
具体的には、以下の点が脆弱性として挙げられます。
- 認証の欠如: データベースへのアクセスに認証が要求されなかったため、誰でも自由にデータにアクセスすることができました。
- ポートの公開: ClickHouseデータベースのポートが外部に公開されていたため、外部からの攻撃に晒されていました。
- 漏洩した可能性のある情報の内容と影響範囲
- 漏洩した可能性のある情報は、log_streamというテーブルに記録された100万件以上のログデータです。
このデータには、以下の情報が含まれていました。
string.values フィールドには、チャット履歴、APIキー、バックエンド情報、操作メタデータが含まれていました。 APIキーには、様々な種類のキーが含まれており、例えば、データベースへのアクセスキー、外部サービスとの連携に使用するキー、決済処理に使用するキーなどが考えられます。バックエンド情報には、サーバーのIPアドレス、データベースの接続情報、システム構成などの情報が含まれている可能性があります。操作メタデータには、ユーザーがいつ、どの操作を行ったかといった情報が含まれている可能性があります。
これらの情報が漏洩した場合、以下の影響が考えられます。
- ユーザーのプライバシー侵害: チャット履歴には、個人間の会話、金融情報、健康情報など、非常にデリケートな情報が含まれている可能性があります。これらの情報が漏洩した場合、ユーザーのプライバシーが深刻に侵害される可能性があります。
- サービスの不正利用: APIキーが漏洩した場合、攻撃者はDeepSeekのサービスを不正に利用する可能性があります。例えば、不正にアカウントを作成したり、データを改ざんしたり、サービスを妨害したりする可能性があります。
- 企業の信用失墜: 情報漏洩は企業の信用を大きく損なう可能性があります。顧客離れや株価下落などの経済的な損失だけでなく、企業のイメージダウンは長期的な影響を与える可能性があります。
Deepseekログイン画面
研究者以外の方はまだAPIは利用していないと思うので、チャット利用した場合は、下記で入力したデータが漏洩する可能性があります。
https://chat.deepseek.com/
https://www.deepseek.com/ 等からログイン