[解決済み] Splunk : ユニークフィールドを使用したレコードの重複排除
質問
ログ分析ソリューションをElasticSearch/KibanaからSplunkに移行することを検討しています。
現在、ElasticSearch では、インデックス作成時に "document id" を使用してレコードの重複を排除しています。
https://www.elastic.co/guide/en/elasticsearch/reference/current/docs-index_.html
各ログレコードの内容のハッシュ値を用いてidを生成する。
Splunkでは、Splunkインデックスで各レコードにユニークな内部フィールド "_cd"が見つかりました。 https://docs.splunk.com/Documentation/Splunk/8.1.0/Knowledge/Usedefaultfields
しかし、HTTP Event Collector を使用してレコードを取り込む場合、この "_cd" フィールドをリクエストに埋め込む方法は見つかりませんでした。 https://docs.splunk.com/Documentation/Splunk/8.1.0/Data/HECExamples
Splunk でこれを実現するためのヒントがあれば教えてください。
どのように解決するのですか?
何を実現しようとしているのか?
もしあなたがHECに"unique"イベントを送っていたり、"unique"ログでUFを実行しているなら、インデックス作成時に重複した"レコードは決して取得されないでしょう。
それは 音 は、同じデータをアグリゲーション・プラットフォームに再送しているようですが、これは アグリゲーター でなく、あなたの 送信 の処理を行います。
をやっているのとほぼ同じ。 MySQL / PostgreSQL 存在しない場合は挿入する。もしそれがあなたの状況の正しい理解であれば、あなたのステートメントに基づいて
<ブロッククオート
現在、ElasticSearchで"document id"を使用して、インデックス作成時にレコードの重複を排除しています。
https://www.elastic.co/guide/en/elasticsearch/reference/current/docs-index_.html
各ログレコードの内容のハッシュを利用してidを生成しています。
で何が問題になっているのかを評価する必要があります。 送信 のプロセスで、データを取り込む前に事前にクリーニングする必要があると感じています。
確かに、Splunk はインデックス作成時にレコードの重複を排除しません。 前提 を送信してきたデータが「正しい」ものであることを確認します。
そもそも、どうやって重複したデータを取得しているのですか?
Splunk のフィールドで、アンダースコアで始まるもの (たとえば
_time
,
_cd
など)は
ではない
編集可能/送信可能 - データを受信したときに Splunk が生成するものです。つまり、これらはすべて
内部
のフィールドがあります。検索可能。使える。しかし、上書きはできない。
もし、あなたが
本当に
重複したデータが多くて困っている。
送信プロセスを修正する方法はありません。
その場合、重複排除に頼る必要があります。
オペレーション
で
SPL
いつ
検索
のために、あるいは摂取したものについてのレポート (
主に
を使用することで
stats
と、どうしても必要な場合・やむを得ない場合。
dedup
).
関連
-
[解決済み】Splunk : JSON配列を検索するSpath
-
[解決済み] Splunkです。複数のイベントから統計情報を取得し、1つの結合された出力を期待する
-
[解決済み] Splunk Alert - IP アドレスを時間範囲のみから除外する。
-
[解決済み] splunk のタイムチャートテーブルで、ある行の値に基づいて降順でソートすること
-
[解決済み] Splunk で複数のフィールドでイベントをグループ化する
-
[解決済み] Splunk でユニークな検索を行う方法
-
[解決済み] Splunk : ユニークフィールドを使用したレコードの重複排除
-
[解決済み] Splunk アクセス可能なインデックスとソースを一覧表示する
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】Splunk : JSON配列を検索するSpath
-
[解決済み] Splunkです。複数のイベントから統計情報を取得し、1つの結合された出力を期待する
-
[解決済み] Splunk Alert - IP アドレスを時間範囲のみから除外する。
-
[解決済み] splunk のタイムチャートテーブルで、ある行の値に基づいて降順でソートすること
-
[解決済み] Splunk で複数のフィールドでイベントをグループ化する
-
[解決済み] Splunk でユニークな検索を行う方法
-
[解決済み] Splunk : ユニークフィールドを使用したレコードの重複排除
-
[解決済み] Splunk アクセス可能なインデックスとソースを一覧表示する
-
[解決済み] MySQLで'insert if not exists'を行うにはどうしたらいいですか?
-
[解決済み] Postgresqlで「挿入無視」と「重複キー更新」(SQLマージ)をエミュレートする方法は?