Отримання та експорт вибірок з бази англійських ключових слів

Після того, як ви завантажили базу ключових слів англійської мови, встановили PostgreSQL, імпортували англійські ключові слова в таблицю і оптимізували базу даних, потрібно навчитися робити вибірки, що описано в цьому і наступних розділах покрокової інструкції.

Ще раз нагадуємо, що на скріншотах показано роботу з мінімальною базою, відповідно і час вказано для мінімальної бази, але робота з розширеною та максимальною базою займе більше часу.

1. Вибірка за одним словом

Запросимо вибірку словосполучень, до яких входить слово flights . У ході тестування синтаксису вибірок встановимо ліміт кількості виведених результатів у 100 результатів (взагалі, у разі виконання великих вибірок з великих баз має сенс протестувати синтаксис перед запуском процесу вибірки, тому краще для цих цілей обмежити кількість результатів).

select "keyword" from "eng_data_table" where to_tsvector('english', "keyword") @@to_tsquery('english', 'flights') limit 100;

вибірок

Така вибірка виконається практично миттєво. Надалі ми наводитимемо приклади з обмеженням кількості результатів. Щоб прибрати це обмеження, потрібно прибрати з запиту limit 100 і перенести крапку з комою (;) в кінець запиту. Рекомендуємо для тестування завжди використовувати limit , щоб вибірка виконувалася швидше, а видаляти обмеження тільки при експорті у файл.

У результатах вибірки є словоформи. У нашому випадку, наприклад, ми використовували множину іменника flights , але результати є і єдине число flight , оскільки використовуються правила для англійської мови. Частина слівпри пошуку ігнорується, наприклад, артиклі, є стоп-словами.

2. Вибірка за двома словами

Зробимо вибірку за двома словами - "cheap flights". Для цього візьмемо попередній синтаксис запиту та додамо нове слово зі знаком & :

select "keyword" from "eng_data_table" where to_tsvector('english', "keyword") @@ to_tsquery('english', 'flights & cheap' ) limit 100;

експорт

Примітка: Слова в запиті SQL можуть бути записані в будь-якому порядку. У результатах вибірки будуть словосполучення, до яких входять обидва слова також у будь-якому порядку.

3. Вибірка за трьома словами

Зробимо вибірку за трьома словами - "cheap flights europe". За аналогією з попереднім запитом додаємо третє слово зі знаком & :

select "keyword" from "eng_data_table" where to_tsvector('english', "keyword") @@ to_tsquery('english', 'flights & cheap & europe ') limit 100;

англійських

4.Вибірка за трьома словами з одним винятком

Додамо ще одну дію - зробимо вибірку за трьома словами "cheap flights europe" і при цьому виключимо з вибірки входження зі словом "china":

англійських

5.Вибірка за трьома словами з двома винятками

Зробимо вибірку за трьома словами «cheap flights europe» і виключаючи два слова «china» АБО «korea» :

отримання

Після того, як ми довідалися, як робити основні типи SQL запитів для формування вибірок, нам потрібно навчитися їх зберігати.

6. Експорт результатів вибірки

Експортуємо результати вибірки у файл keyword_selection.txt, який у нашому прикладі знаходиться на диску C: у папці temp:

отримання

Як було сказано вище, ми перевіряємо запити з обмеженням кількості результатів, але ми хочемо зберегтиповну вибірку, а для цього ліміт результатів потрібно забрати:

експорт

У наступному розділі наведено приклади вибірок, що включають об'єднання результатів кількох вибірок, сортування, виведення та експорт кількісної інформації.

Якщо в інструкції є неточності або незрозумілі місця, напишіть, будь ласка, до нашої служби підтримки.