概要
SCU コスト見積もり
このエージェントは通常、 0,01 - 1 SCU 分析の実行ごと。分類データの量と選択した分析モードの深さによって異なります。ディープ分析モードでは、より多くの SCU を使用する場合があります。
はじめに
Classification Optimizer は、Microsoft Purview のデータ分類を最大限に活用するのに役立ちます。特定の機密情報がなぜ検出をすり抜け続けるのか、あるいはなぜ誤検知に埋もれてしまうのかと疑問に思ったことがあるなら、このエージェントはまさにあなた向けです。これは、Sensitive Information Types (SITs) が実際の現場でどのように機能しているかを分析し、存在に気づかなかったパターンを見つけ、分類精度をどのように改善すべきかを具体的に示します。




機能
実環境での SIT のパフォーマンスを分析 理論だけでなく、実際の検出データに基づいて
共起パターンを検出 どの機密タイプが一緒に現れるかを示します
分類のギャップを特定 重要なデータが検出されていない箇所
冗長な分類子を発見 重複して不要な複雑さを生み出しているもの
新しい複合 SIT を推奨 継続的に一緒に現れるパターンに基づいて
パラメーターの調整を提案 誤検知を減らし、精度を向上させるために
学習可能な分類子の候補を特定 複雑でコンテキストに依存するパターン向けに
優先度付きの推奨事項を提供 統計的な裏付け付きで(support、lift、confidence)
ユース ケース
1. 誤検知の削減
DLP ポリシーが常に発火しているのに、アラートの半分は実際の問題ではありません。ユーザーは、意味のないブロックに不満を感じています。Classification Optimizer は、どの SIT が問題を引き起こしているかを分析し、保護を損なうことなく精度を向上させるための具体的なパラメーター調整(信頼度レベル、インスタンス数、しきい値)を提案します。
2. 検出精度の向上
重要な機密データがポリシーをすり抜けています。分類子が本来検出すべきものをすべて拾えていないのではないかと疑っています。このエージェントは、カバレッジのギャップを特定し、検出パターンを分析し、現在見逃しているものを検出するための新しい SIT の組み合わせや学習可能な分類子を推奨します。
3. 複雑な分類スキームの簡素化
時間の経過とともに、何十、何百もの SIT が蓄積され、今ではどれが本当に価値があるのか誰にも分からなくなっています。Classification Optimizer は、どの分類子が冗長か、どれが常に一緒に現れるか(そして統合すべきか)、どれが有用なものをまったく検出していないかを示します。ようやくその分類子の乱立を整理できます。
4. より良い複合分類子の構築
特定の機密データの種類が一緒に現れる傾向があることは分かっていても(たとえば、パスポート番号と生年月日など)、適切な複合 SIT を手動で作成するのは当てずっぽうです。このエージェントは、統計指標を用いて共起パターンを分析し、どの SIT を、どのパラメーターで組み合わせるべきかを正確に推奨します。
5. 規制要件へのより効果的な対応
コンプライアンス フレームワークでは特定のデータ保護が求められますが、現在の SIT はそれらの要件に一致していません。Classification Optimizer は、規制要件に関連する戦略的なギャップを特定し、それらを埋めるための新しい分類子または学習可能な分類子を提案します。
なぜ Classification Optimizer なのか?
誤検知の過多: DLP アラートが至る所で発生しているが、ほとんどは実際の問題ではない
精度の調整: 保護を維持しながらノイズを減らすための具体的なパラメーター提案
重要なデータのすり抜け: ポリシーが本来検出すべきものをすべて拾えていない
ギャップ分析: 見逃されているものを特定し、新しい検出パターンを提案
分類子の混乱: SIT が多すぎて、どれが重要か不明
使用状況分析: どの分類子が実際に価値があり、どれが冗長かを示す
手作業の推測: データではなく直感に基づいて複合 SIT を作成している
パターンの発見: 統計分析により、どの SIT が継続的に共起するかを明らかにする
時間のかかる分析: 分類の有効性を手動で確認するのは非常に時間がかかる
自動化されたインサイト: 数分で、優先順位付きの推奨事項を含む完全な分析を提供
戦略的な方向性がない: 分類改善の取り組みをどこに集中すべきか不明
優先順位付きロードマップ: 影響度と支援指標に基づいてランク付けされた推奨事項
仕組み
入力内容:
指定した期間(既定 30 日)の Purview アラート データと検出イベント
既存の SIT 構成と検出パターン
分類分析と使用状況データ
実際の SIT 検出を示すセキュリティ イベント
SharePoint、Exchange、およびファイルの分類データ
動作内容:
各 SIT のベースライン指標(検出頻度、分布)を計算
どの SIT が一緒に現れるかを示す共起行列を作成
統計分析(support、lift、conditional probability)を適用
パターン、ギャップ、最適化の機会を特定
技術的な根拠と優先順位付けを伴う推奨事項を生成
出力内容:
ベースラインの SIT パフォーマンス指標
統計的有意性のある共起パターン
提案パラメーター付きの新しい複合 SIT 推奨
既存の SIT に対するパラメーター調整のガイダンス
複雑なパターン向けの学習可能な分類子候補
ポリシー最適化の提案(スコープ設定、ルール調整、グループ化)
期待される影響を伴う優先度付きアクション プラン
詳細な分析手順を示すデバッグ出力(オプション)
最終更新
役に立ちましたか?