1. ホーム
  2. Web プログラミング
  3. PHP プログラミング
  4. phpのヒント

ElasticSearchの検索エンジン処理をPHPで解説

2022-01-14 11:27:14

古代の学習は無力なまま、若くて強いカンフーオールドになる。

この記事はあなたに少し助けをもたらすことができれば、私はサポートを表示するには、キー3社飛ぶウサギの弟を与えるために願って、あなたに仲間をありがとうございました。

I. インストール

composer経由でのインストール

composer require 'elasticsearch/elasticsearch'

次に、使用する

ESクラスの作成

<?php
 
require 'vendor/autoload.php';
 
//if no password is set
$es = \Elasticsearch\ClientBuilder::create()->setHosts(['xxx.xxx.xxx.xxx'])->build();
 
//if es sets a password
$es = \Elasticsearch\ClientBuilder::create()->setHosts(['http://username:[email protected]:9200'])->build()

III. 新しいESデータベース

のインデックスは、リレーショナルデータ(以下、MySQL)内のデータベースに対応し、MySQL内のインデックスには対応していない

<?php
$params = [
    'index' => 'autofelix_db', #index names cannot start with uppercase and underscore
    'body' => [
        'settings' => [
            'number_of_shards' => 5,
            'number_of_replicas' => 0
        ]
    ]
];
$es->indices()->create($params);

IV. テーブルを作成する

  • MySQL では、データベースを持つだけでは不十分で、テーブルを作成する必要がありますが、ES は同じです。
  • ESの型は、MySQLのテーブルに対応しています。
  • ES6以前は、MySQLでデータベースが複数のテーブルを持つように、インデックスも複数のタイプを持つことができた
  • しかし、ES6以降では、1つのインデックスにつき1つのタイプしか許されない
  • フィールドを定義する際、各フィールドに個別の型を定義できることがわかります。
  • first_nameにカスタムセパレータのikもありますが、これは別途プラグインをインストールする必要があります
<?php
$params = [
    'index' => 'autofelix_db',
    'type' => 'autofelix_table',
    'body' => [
        'mytype' => [
            '_source' => [
                'enabled' => true
            ],
            'properties' => [
                'id' => [
                    'type' => 'integer'
                ],
                'first_name' => [
                    'type' => 'text',
                    'analyzer' => 'ik_max_word'
                ],
                'last_name' => [
                    'type' => 'text',
                    'analyzer' => 'ik_max_word'
                ],
                'age' => [
                    'type' => 'integer'
                ]
            ]
        ]
    ]
];
$es->indices()->putMapping($params);

V. データの挿入

  • データベースとテーブルが利用可能になったので、データを挿入することができます。
  • ESの中のデータをドキュメントと呼びます
  • さらにデータを挿入し、後で検索機能をシミュレートすることができます
<?php
$params = [
    'index' => 'autofelix_db',
    'type' => 'autofelix_table',
    //'id' => 1, # you can specify the id manually, or you can generate it randomly without specifying it
    'body' => [
        'first_name' => 'fly',
        'last_name' => 'rabbit',
        'age' => 26
    ]
];
$es-> index($params);

VI. 全データを問い合わせる

<?php
$data = $es->search();
 
var_dump($data);

VII. 単一データのクエリ

  • データ挿入時にidを指定すると、クエリ時にそのidを追加することができる
  • 挿入時にidを指定しない場合、idは自動的に生成され、全データを照会することでidを確認することができます
<?php
$params = [
    'index' => 'autofelix_db',
    'type' => 'autofelix_table',
    'id' => // the id when you insert the data
];
$data = $es->get($params);

VIII. 検索

場のESエッセンスは検索すること

<?php
$params = [
    'index' => 'autofelix_db',
    'type' => 'autofelix_table',
    'body' => [
        'query' => [
            'constant_score' => [ //non-scoring mode execution
                'filter' => [ //filter, won't calculate relevance, fast
                    'term' => [ //exact lookup, doesn't support multiple terms
                        'first_name' => 'fly'
                    ]
                ]
            ]
        ]
    ]
];
 
$data = $es->search($params);
var_dump($data);

IX. テストコード

Laravelの環境をベースに、データベースの削除、ドキュメントの削除などの操作が含まれています。

<?php
use Elasticsearch\ClientBuilder;
use Faker\Generator as Faker;
 
/**
 * The php live code for ES
 *class EsDemo
{
    private $EsClient = null;
    private $faker = null;
 
    /**
     * To simplify the test, this test only operates on one Index, one Type by default
     *    private $index = 'autofelix_db';
    private $type = 'autofelix_table';
 
    public function __construct(Faker $faker)
    {
        /**
         * Instantiate the ES client
         *        $this->EsClient = ClientBuilder::create()->setHosts(['xxx.xxx.xxx.xxx'])->build();
        /**
         * This is a data generation library
         *        $this->faker = $faker;
    }
 
    /**
     * Batch generation of documents
     * @param $num
     *    public function generateDoc($num = 100) {
        foreach (range(1,$num) as $item) {
            $this->putDoc([
                'first_name' => $this->faker->name,
                'last_name' => $this->faker->name,
                'age' => $this->faker->numberBetween(20,80)
            ]);
        }
    }
 
    /**
     * Delete a document
     * @param $id
     * @return array
     *    public function delDoc($id) {
        $params = [
            'index' => $this->index,
            'type' => $this->type,
            'id' => $id
        ];
        return $this->EsClient->delete($params);
    }
 
    /**
     * search document, query is the query criteria
     * @param array $query
     * @param int $from
     * @param int $size
     * @return array
     *    public function search($query = [], $from = 0, $size = 5) {
// $query = [
// 'query' => [
// 'bool' => [
// 'must' => [
// 'match' => [
// 'first_name' => 'Cronin',
// ]
// ],
// 'filter' => [ // 'filter' => [
// 'range' => [
// 'age' => ['gt' => 76]
// ]
// ]
// ]
/// ]
// ];
        $params = [
            'index' => $this->index,
// 'index' => 'm*', #index and type are fuzzy matchable, even if both parameters are optional
            'type' => $this->type,
            '_source' => ['first_name','age'], // the field specified by the request
            'body' => array_merge([
                'from' => $from,
                'size' => $size
            ],$query)
        ];
        return $this-> EsClient-> search($params);
    }
 
    /**
     * Get multiple documents at once
     * @param $ids
     * @return array
     *    public function getDocs($ids) {
        $params = [
            'index' => $this->index,
            'type' => $this-> type,
            'body' => ['ids' => $ids]
        ];
        return $this-> EsClient-> mget($params);
    }
 
    /**
     * Get a single document
     * @param $id
     * @return array
     *    public function getDoc($id) {
        $params = [
            'index' => $this->index,
            'type' => $this->type,
            'id' => $id
        ];
        return $this->EsClient->get($params);
    }
 
    /**
     * Update a document
     * @param $id
     * @return array
     *    public function updateDoc($id) {
        $params = [
            'index' => $this->index,
            'type' => $this->type,
            'id' => $id,
            'body' => [
                'doc' => [
                    'first_name' => 'Zhang',
                    'last_name' => 'three',
                    'age' => 99
                ]
            ]
        ];
        return $this-> EsClient-> update($params);
    }
 
    /**
     * Add a document to the Type of the Index
     * @param array $body
     * @return void
     *    public function putDoc($body = []) {
        $params = [
            'index' => $this->index,
            'type' => $this->type,
            // 'id' => 1, # you can specify the id manually, or you can generate it randomly without specifying
            'bod