> For the complete documentation index, see [llms.txt](https://agents.glueckkanja.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://agents.glueckkanja.com/jp/agents/classification-optimizer/overview.md).

# 概要

> &#x20;**SCU コスト見積もり**&#x20;
>
> このエージェントは通常、 **0,01 - 1 SCU** 分析の実行ごと。分類データの量と選択した分析モードの深さによって異なります。ディープ分析モードでは、より多くの SCU を使用する場合があります。

### はじめに

Classification Optimizer は、Microsoft Purview のデータ分類を最大限に活用するのに役立ちます。特定の機密情報がなぜ検出をすり抜け続けるのか、あるいはなぜ誤検知に埋もれてしまうのかと疑問に思ったことがあるなら、このエージェントはまさにあなた向けです。これは、Sensitive Information Types (SITs) が実際の現場でどのように機能しているかを分析し、存在に気づかなかったパターンを見つけ、分類精度をどのように改善すべきかを具体的に示します。

<figure><img src="/files/90df0c9dc71673acc68f6e6e708d8930c6f62d0d" alt=""><figcaption></figcaption></figure>

<div><figure><img src="/files/acccbc58775930955209dfaf9fc46baadd5a705d" alt=""><figcaption></figcaption></figure> <figure><img src="/files/4cc874452bdacf9af459fca00eeaf83f70e435f8" alt=""><figcaption></figcaption></figure> <figure><img src="/files/1e485573f177b17070f85fb69c61d6bffe3479df" alt=""><figcaption></figcaption></figure></div>

### 機能

* **実環境での SIT のパフォーマンスを分析** 理論だけでなく、実際の検出データに基づいて
* **共起パターンを検出** どの機密タイプが一緒に現れるかを示します
* **分類のギャップを特定** 重要なデータが検出されていない箇所
* **冗長な分類子を発見** 重複して不要な複雑さを生み出しているもの
* **新しい複合 SIT を推奨** 継続的に一緒に現れるパターンに基づいて
* **パラメーターの調整を提案** 誤検知を減らし、精度を向上させるために
* **学習可能な分類子の候補を特定** 複雑でコンテキストに依存するパターン向けに
* **優先度付きの推奨事項を提供** 統計的な裏付け付きで（support、lift、confidence）

### ユース ケース

#### 1. 誤検知の削減

DLP ポリシーが常に発火しているのに、アラートの半分は実際の問題ではありません。ユーザーは、意味のないブロックに不満を感じています。Classification Optimizer は、どの SIT が問題を引き起こしているかを分析し、保護を損なうことなく精度を向上させるための具体的なパラメーター調整（信頼度レベル、インスタンス数、しきい値）を提案します。

#### 2. 検出精度の向上

重要な機密データがポリシーをすり抜けています。分類子が本来検出すべきものをすべて拾えていないのではないかと疑っています。このエージェントは、カバレッジのギャップを特定し、検出パターンを分析し、現在見逃しているものを検出するための新しい SIT の組み合わせや学習可能な分類子を推奨します。

#### 3. 複雑な分類スキームの簡素化

時間の経過とともに、何十、何百もの SIT が蓄積され、今ではどれが本当に価値があるのか誰にも分からなくなっています。Classification Optimizer は、どの分類子が冗長か、どれが常に一緒に現れるか（そして統合すべきか）、どれが有用なものをまったく検出していないかを示します。ようやくその分類子の乱立を整理できます。

#### 4. より良い複合分類子の構築

特定の機密データの種類が一緒に現れる傾向があることは分かっていても（たとえば、パスポート番号と生年月日など）、適切な複合 SIT を手動で作成するのは当てずっぽうです。このエージェントは、統計指標を用いて共起パターンを分析し、どの SIT を、どのパラメーターで組み合わせるべきかを正確に推奨します。

#### 5. 規制要件へのより効果的な対応

コンプライアンス フレームワークでは特定のデータ保護が求められますが、現在の SIT はそれらの要件に一致していません。Classification Optimizer は、規制要件に関連する戦略的なギャップを特定し、それらを埋めるための新しい分類子または学習可能な分類子を提案します。

### なぜ Classification Optimizer なのか？

| あなたが直面している問題                                    | これがどう役立つか                                     |
| ----------------------------------------------- | --------------------------------------------- |
| **誤検知の過多**: DLP アラートが至る所で発生しているが、ほとんどは実際の問題ではない | **精度の調整**: 保護を維持しながらノイズを減らすための具体的なパラメーター提案    |
| **重要なデータのすり抜け**: ポリシーが本来検出すべきものをすべて拾えていない       | **ギャップ分析**: 見逃されているものを特定し、新しい検出パターンを提案        |
| **分類子の混乱**: SIT が多すぎて、どれが重要か不明                  | **使用状況分析**: どの分類子が実際に価値があり、どれが冗長かを示す          |
| **手作業の推測**: データではなく直感に基づいて複合 SIT を作成している        | **パターンの発見**: 統計分析により、どの SIT が継続的に共起するかを明らかにする |
| **時間のかかる分析**: 分類の有効性を手動で確認するのは非常に時間がかかる         | **自動化されたインサイト**: 数分で、優先順位付きの推奨事項を含む完全な分析を提供   |
| **戦略的な方向性がない**: 分類改善の取り組みをどこに集中すべきか不明           | **優先順位付きロードマップ**: 影響度と支援指標に基づいてランク付けされた推奨事項   |

### 仕組み

**入力内容：**

* 指定した期間（既定 30 日）の Purview アラート データと検出イベント
* 既存の SIT 構成と検出パターン
* 分類分析と使用状況データ
* 実際の SIT 検出を示すセキュリティ イベント
* SharePoint、Exchange、およびファイルの分類データ

**動作内容：**

* 各 SIT のベースライン指標（検出頻度、分布）を計算
* どの SIT が一緒に現れるかを示す共起行列を作成
* 統計分析（support、lift、conditional probability）を適用
* パターン、ギャップ、最適化の機会を特定
* 技術的な根拠と優先順位付けを伴う推奨事項を生成

**出力内容：**

* ベースラインの SIT パフォーマンス指標
* 統計的有意性のある共起パターン
* 提案パラメーター付きの新しい複合 SIT 推奨
* 既存の SIT に対するパラメーター調整のガイダンス
* 複雑なパターン向けの学習可能な分類子候補
* ポリシー最適化の提案（スコープ設定、ルール調整、グループ化）
* 期待される影響を伴う優先度付きアクション プラン
* 詳細な分析手順を示すデバッグ出力（オプション）


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://agents.glueckkanja.com/jp/agents/classification-optimizer/overview.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.