Реферат
Мова запитів SQL
Мова запитів
SQL є стандартною мовою для роботи з реляційними БД і в даний час підтримується всіма продуктами представленими на ринку. Її було розроблено в компанії ІВМ на початку 70-х років. Поточний стандарт цієї мови, на який ми будемо посилатися, має назву SQL/92.
Створення будь-якої таблиці передбачає визначення типу даних. Тип даних стовпчика визначає тип інформації, яка в ньому зберігається. Для того щоб визначити тип стовпчика необхідно після імені стовпчика вказати одне з ключових слів, яким позначається тип. Назви типів є регістрово незалежними. Після визначення тип стовпчика буде зберігатися як його характеристика, яку змінити неможна.
Розглянемо всі стандартні типи даних, які можна використовувати.
Тип даних: цілі числа
Цілі числа складають великий клас даних, які можна зберігати в БД.
Тип даних | Tinyint | smallint | int | Bigint |
Розмір | 1 байт | 2 байти | 4 байти | 8 байт |
Значення | + | +/- | +/- | +/- |
Мін зн-ня | 0 | -32768 (-215) | -231 | -263 |
Макс зн-ня | 255 | 32768 (215 -1) | 231 -1 | 263 –1 |
Тип даних: числа з плаваючою комою
Проблеми, які виникають з дійсними числами, це – округлення як при використанні у виразах, так і при виведенні результата. При цьому в памўяті їх представлення не змінюється. Виникнення похибки. Їх деколи називають наближеними типами числових даних, адже ці значення можна представити лише з певною точністю. Тому слід уникати виконання операції порівняння (наприклад у конструкції WHERE) над даними, які належать наближеному типу. До наближених типів належать:
Тип REAL
Розмір: 2 байти;
Діапазон: -3,4Е-38 до +3,4Е+38
Точність: до 7 цифер.
Тип FLOAT[(n)]
Розмір: 8 байт;
Діапазон: -1,7Е-308 до +1,7Е+308
Точність: до 15 цифер.
Якщо вказати значення n типу float в інтервалі від 1 до 7, значення займатиме 4 байти, а від 8 до 15 – 8 байт. Те саме відбудеться якщо явно не вказати точність. За замовчуванням – точність 15.
Тип DECIMAL[(p[, s])] та NUMERIC[(p[, s])]
Ці типи, на відміну від двох попередніх, дозволяють зберігати десяткові числа точно, без змін.
Допустимий діапазон значень визначається значеннями параметрами p і s і змінюється від (-10Е-38) до (+10Е+38).
Розмір: 2 – 17 байт.
Параметр р визначає точність, з якою можна зберігати десяткове число (тобто загальну кількість цифр, що зберігаються). Параметр s визначає кількість цифр після десяткової крапки (воно повинно бути менше або рівне р). Якщо ці параметри не вказати явно, їм будуть присвоєні стандартні значення (р=18, s=0).
Текстові типи даних
Стандарт Unicode, що підтримується у більшості сучасних СКБД, був розроблений з метою подолання обмежень, властивих стандартним наборам символів. В цьому стандарті для збереження символів використовується 2 байти. Їх достатньо для кодування майже всіх символів, що використовуються в світі. Наприклад, загальний набір китайських ієрогліфів складає 21000 з 65536 можливих у Юнікод символів. Оскільки для збереження символьної інформації використовується вдвічі більше місця в памўяті, використовується декілька типів символьної інформації, до складу назв яких входить слово CHAR.
Тип CHAR(n)
Діапазон: до 8000 ANSI-символів
Розмір: 1 байт для кожного символа.
Розмір: число в дужках, яке визначає кількість байт, що виділяються для кожного значення у стовпчику.
Максимум: 15 символів. (значення за замовчуванням).
Нприклад, якщо тип стовпчика визначено CHAR(15), а вводите менше 15 символів, решта позицій заповнюються пропусками. Тобто все рівно виділятиметься 15 байт.
Тип NCHAR
Практично ті самі характеристики, що і попередник. Єдина відмінність між ними полягає в тому, що дані цього типу можуть містити не більше 4000 символів Unicode.
Тип VARCHAR (varying char)
Діапазон: до 8000 символів.
Розмір памўяті змінюється в залежності від кількості введених символів у елементах стовпчика.
Наприклад, ви визначили тип стовпчика VARCHAR(15), але ввели менше символів, в цьому випадку пропускаи не будуть додаватися, тобто подібний елемент займатиме менше ніж 15 байт. Можна зекономити місце на диску.
ТипNVARCHAR
Те саме, що і варчар. Єдина відмінність – до 4000 символів Юнікод складають діапазон можливих значень.
Якщо Ви перевищити максимальний (або заданий) розмір поля, СКБД автоматично видаляє решта символів без попередження.
Типи DATETIME та SMALLDATETIME
Використовуються для зберігання комбінацій дати та часу зручніше ніж за допомогою символьних типів. Окремих типів для зберігання дати або окремо часу не існує.
datetime | Smalldatetime | |
Розмір обл.пам’яті | 8 байт | 4 байти |
Точність | 3,33 мс | 1 хв |
Мін зн-ня | 1 січня 1753 р. | 1 січня 1900 р. |
Макс зн-ня | 31 грудня 9999 р. | 6 червня 2079р. |
ТипDATETIME
4 перші байти для збереження кількості днів до і після базової дати, якою є 1 січні 1900 року. Відўємні числа позначають подію до цієї дати, а додатні – після.
Заокруглення відбувається з недостачею.
Формат відображення: МММ DD YYYY hh:miAM/PM. Наприклад, Sep 23 1949 11:11 PM.
При використанні оператора Insert дані цього типу заключаються в одинарні лапки.
Неважливо, в якому порядку ви вкажете дату і час, в будь-якому разі SQL Server розпізнає і збереже їх у правильному порядку.
При вводі значень типу Datetime можна використовувати для дати символи верхнього і нижнього регістрів і залишати між місяцем, днем і роком один і більше пробелів.
Дата і час повинні відокремлюватися пропусками. Якщо ввести дату без часу, то буде прийнято стандартний час 12:00 АМ (24:00).
Якщо ж опустити дату, то буде встановлено стандартне значення 1 січня 1900.
Способи введення дат:
Sept 23 1949
SEPT 23 1949
September 23 1949
Sept 1949 23
1949 sept 23
При використанні числового формату значень DATETIME дозволяється використання символів нахиленої риски, дефіса та крапки в якості розділювала між одиницями часу:
6/24/71
6-24-1971
6.24.1971
06.24.71
Значення без розділювачів, що складається з 6 або 8 цифр, завжди інтерпретується у наступному порядку: рік, місяць і день. Причому на день і місяць завжди виділяється по 2 знаки.
Зауважте, якщо ви працюєте з даними DATETIME, і в якості значення вставите порожній елемент, то не одержите значення NULL. Якщо в якості значення дати і часу ввести два апострофи, не вставляючи між ними ніяких символів, SQL Server інтерпретує їх як 1 січня 1900 року, 24:00.
Одиниці часу вводять у наступному порядку: години, хвилини, секунди і мілісекунди. Щоб набір чисел можна було інтерпретувати як час, а не дату, потрідно між одиницями часу ставити двікрапки.
11:21
11:21:30:871
6 ам
7 РМ
Налаштувати формат можна за допомогою команди SET DATEFORMAT (mdy/ymd), SET LENGUAGE задає мову.
Тип SMALLDATETIME використовується для зберігання даних у більш вузькому діапазоні і з меншою точністю. Проте економить місце на диску.
Спеціальні типи даних
Тип ВІТ
Діапазон: 2 значення – нуль(0) або одиницю (1).
Розмір: 1 біт
Якщо в стовпчик, позначений цим типом ввести число більше за одиницю, буде збережено значення одиниці.
Неможна використовувати для збереження елементів NULL.
Цей тип відповідає типу BOOLEAN.
За допомогою одного байта можна представити дані, що зберігаються у восьми різних стовпчиках таблиці, причому стовпці типу ВІТ не обов’язково повинні розташовуватися поруч.
Тип TIMESTAMP
Якщо для стовпця таблиці визначено цей тип, то кожного разу при вставці нового чи обновленні існуючого рядка у стовпеці типу TIMESTAMP буде автоматично розміщуватись значення лічильника. Зверніть увагу на те, що у полі даного типу неможно явно розмістити значення.
Значення лічильника, що розміщується у полі даного типу, вказує кількість виконаних операцій.. значення зберігаються у форматі VARBINARY(8), а не в форматі DATETIME або SMALLDATETIME. Дозволені значення NULL за замовчуванням. Це не дата чи час, але воно завжди унікальне у межах таблиці і бази даних. Цей тип може бути визначений лише для одного стовпця таблиці.
Даний тип часто використовується для гарантії того, що рядок визначається унікальним чином. Як правило, виконуючи обновлення стовпців у рідку, в директиві WHERE оператора UPDATE визначається стовпець типу TIMESTAMP. Це дає гарантії, що буде обновлено лише один рядок у таблиці. Можна бути впевненим в унікальності значення лічильника, оскільки сервер обновлює його кожного разу при вставці чи обновленні рядка.
Також лічильник у директиві WHERE використовується щоб не дозволити двом користувачам обновити один і той самий рядок. Оскільки при кожній модифікації лічильник зміннює своє значення автоматично.
Тип BINARY(n) Подібні символьним аналогам. Різниця полягає в тому, що використовується для зберігання бітових послідовностей (ланцюжків), розміром від 1 до 8000 байт. Використовуються для зберігання шістнадцяткових значень у форматі 0х…. (0-9, A-F),без лапок.
Число в дужках означає довжину цих бітових ланцюжків (і розмір пам’яті, що займається).
Мінімальний розмір: 1 байт
Формат: 0хА0, 0хff (максимальне для binary(1)), 0xffff(binary(2)).
Якщо задати значення, що за довжиною менше за число в дужках, на місці решти знаків поставляться нулі.
Тип VARBINARY(n) також використовується для зберігання бітових ланцюжків, тої самої довжини. На відміну від попередника, змінні цього типу займають стільки місця у пам’яті, скільки необхідно для їх розміру, що вказується у дужках.
Типи ТЕХТ и ІМАGЕ
Для багатьох речень необхідно зберігати більше ніж 8000 байт даних.
Механізм BLOB забезпечує механізм для зберігання двійкових об’єктів, що мають розмір до 2 ГБ на рядок.
Тип техт, звичайно використовується для зберігання символів, які можна безпосередньо висести на екран монітора або на прінтер. Наприклад, лише у єдиному полі одного стовпця, позначеного типом текс, можна зберегти цілу автобіографію або резюме.
Дані цього типу зберігаються у вигляді рядків фіксованої довжини у розподіленій для цього області розміром 8 Кбайт. Додаткові області чи сторінки по 8 Кбайт динамічно додаються і об’єднуються разом. Якщо для вставки даних у стовпчик, для якого визначений тип текст, використовувати оператор INSERT, обов’язково дані заключають в одинарні лапки.
Тип NTEXT
Передбачений для зберігання символів у форматі UNICODE. Основна відмінність – для збереження символів Юнікод потрібно 2 байти, отже у стовпці типу NTEXT можна зберегти лише половину від максимально можливої кількості симовлів для типу ТЕКСТ.
Тип IMAGE
Можна використовувати для зберігання двійкових даних, розміром від 1 до близько 2,2 ГБ. Наприклад, в одному значенні стовпця можна зберігати фотографії співробітників, картинки для каталогу тощо. Дані, як правило, не вводяться за допомогою команди INSERT
Дані зберігаються у вигляді елементів фіксованої довжини на діл’янці пам’яті розміром 8 КБ. Дані типу IMAGE не передбачені для виводу безпосередньо на екран. Для цього потрібно використовувати спеціальну програму.
Фінансові типи даних. Тип MONEY
Дозволяє зберігати грошові значення. Дані цього типу фізично зберігаються у вигляді двох частин – цілої і доробової.
Розмір: 8 байт.
Діапазон:
Точність: одна десятитисячна
Тип SMALLMONEY
Вужчий діапазон
Розмір: 4 байти
При вводі значень у стовпець таблиці, для якого визначений грошовий тип, необхідно перед першою цифрою поставити знак долара ($) або іншої валюти, визначеної для певного регіона.
Типи даних, визначені користувачем (User-Defined Datatipes)
Ці типи не є дійсно новими типами даних, такими як у мовах програмування, припустимо масиви чи структури. Створений новий тип можна використовувати для опису стовпців, зручного для користувача. Вводиться новий тип за допомогою функції: sp_addtype у форматі
Sp_addtype phone, ‘char(13)’
Якщо вираз системного типу містить дужки, необхідно взяти його в лапки.
Приклад використання нового типу:
CREATE TABLE my-friends
(id int PRIMARY KEY,
name VARCHAR(20),
phone_num PHONE)
INSERT my_friends (name, phone)
VALUES (‘Pete F’, ‘(408)496-7223’);
Для видалення новоствореного типу: Sp_droptype phone
Атрибути NULL NOT NULL
Якщо в стовпці визначений атрибут НУЛЛ, це дозволяє опустити при вводі даних значення даного стовпчика. І напваки, якщо визначений атрибут НОТ НУЛЛ, стовпчик неможна залишати порожнім підчас вставки рядка. За замовчуванням задається останній атрибут. Атрибут визначається при створенні таблиці після зазначення типу стовпця. Напркилад
Create table t
(x int NULL, y char(10) NULLl). Для позначення атрибуту можна використовувати букви верхнього і нижнього регістрів. Атрибут НУЛЛ не допустимий для поля первинного ключа.
Властивість IDENTITY
Окрім опису типу і атрибуту НУЛЛ (НОТ НУЛЛ) для стовпців можна також визначити властивість IDENTITY (автоматичне збільшення значення). Потрібно вказати початкове значення, що автоматично розміщуватиметься у цьому стовпці в першому рядку таблиці, і приріст, який буде додаватися до попереднього значення стовпчика з кожним новим рядком.
IDENTITY(поч зн-ня, крок)
Id int IDENTITY(1, 11);
Цю властивість можна присвоїти стовпцю з типом всі INT, DECIMAL(p,0), NUMERIC(p,0) але ні в якому разі стовпцю з властивістю НУЛЛ. Якщо не вказати параметри для айдентіті, за замовчуванням встановвляться значення (1,1).
Обмежання.
Крім зазаначення безпосередньо типів та розміру полів таблиці можна задавати обмеження з метою забезпечення цілісності таблиці. При створенні таблиці (або, при її зміні), можна накладати обмеження на значення які можуть вводитися в поля. Якщо це зробити, SQL буде відхиляти будь-які значення які порушують критерії які визначені для того чи іншого поля.
Оператор CREATE TABLE дозволяє не лише створити первинні і зовнішні ключі, визначити унікальні стовпці і рядки, але й вказати обмеження, що використовуються при перевірці допустимих значень даних, а також стандартні значення для стовпців.
CREATE TABLE <table name>
(<column name> <data type> <column constraint>,
<column name> <data type> <column constraint>,);
Обмежання PRIMARY KEY
При розробці таблиці визначається набір потенціальних ключів, тобто тих полів, значення яких однозначно ідентифікують кожен рядок таблиці. Причому з них, як наведено у попередньому прикладі, обирається в якості первинного ключа, для якого неможна використовувати атрибут NULL. Не може бути однакових значень цього поля для різних записів. Первинний ключ забезпечує цілісність даних у стовпцях та є першим кроком до цілісності у всій БД. СКБД створює унікальний індекс для стовпця первинного ключа. Якщо Ви не хочете, щоб створений індекс був кластеризованим, можна використовувати слово NONCLUSTERED при створенні обмеження.
CREATE TABLE customers
(customer_id INT IDENTITY CONSTRAINT customer_pk PRIMARY KEY NONCLUSTERED NOT NULL,
customer_name VARCHAR(20));
або якщо необхідно додати обмежання до вже створеної таблиці:
ALTER TABLE customers
ADD CONSTRAINT customer_pk PRIMARY KEY (customer_id);
Щодо інших потенціальних ключів, то вони є альтернативними ключами, і для позначення їх унікальності використовують унікальне обмеження (UNIQUE), яке гарантує відсутність дублікатів стовпця.
Унікальне обмеження має ті самі атрибути, що й первинний ключ з трьома відмінностями:
Унікальний стовпець може одноразово приймати значення NULL;
Заданим за замовчуванням типом індекса є NONCLUSTERED;
Одна таблиця може мати більше ніж одне обмеження.
Унікальний стовпець не може бути первинним ключем або входити до його складу.
Приклад:
CREATE TABLE Employees
(Name CHAR(20),
DEPARTMENT VARCHAR(20),
BADGE INTEGER UNIQUE);
Можна визначити групу полів як унікальну за допомогою команди обмеження таблиці — UNIQUE. Оголошення унікальності групи означає не унікальність значень складових цієї групи, а унікальність їх комбінації. Наприклад, кожного замовника обслуговує лише один продавець. Це означає, що кожна комбінація номера замовника (cnum) і номера продавця (snum) в таблиці, що створюється нижче повинна бути унікальною.
CREATE TABLE Customers
(cnum integer NOT NULL,
cname char (10) NOT NULL,
city char (10),
rating integer,
snum integer NOT NULL,
UNIQUE (cnum, snum));
Обмежання цілісності за посиланням, або зовнішній ключ
Після створення в одній таблиці поля первинного ключа, значення цього поля можуть використовуватися в іншій таблиці (таблицях) БД для створення істиних тверджень при характеристиці різних сутностей. В інших таблицях це поле вже не є унікальним, має назву поля зовнішнього ключа. FOREIGN KEY пов’язує один або декілька стовпців таблиці з ідентичним номером стовпців іншої таблиці. Його значення не можуть вийти за межі діапазону значень, який у першопочатковій таблиці задається значеннями цього ж поля але вже первинного ключа. Таким чином обмежання FOREIGN KEY використовується лише після створення у відповідній таблиці обмежання PRIMARY KEY для цього є поля. Причому, ці поля не обов’язково повинні мати однакову назв (хоча це бажано), але повинні мати один тип і однакову довжину. Коли в таблиці, де визначено обмежання PRIMARY KEY обновлюються значення стовпців, автоматично обновлюються значення в таблиці, для якої визначено обмежання FOREIGN KEY.
CREATE TABLE Department (Dname CHAR(20), ID_DEP INT Primary key NOT NULL, NUM INT) |
CREATE TABLE Employees (Name CHAR(20), ID_DEP INT, BADGE INT) CONSTRAINT dept_id FOREIGN KEY (ID_DEP) REFERENCES Department (id_dep) |
Обмежання СНЕСК (перевірка)
Можна запобігти небажаним або помилковим введенням значень. Для цього використовується обмеження СНЕСК. Воно наклідає умову на значення, що вводиться, які можна ввести в один або декілька стовпців таблиці. Це область з якої стовпець може одержувати свої значення. СНЕСК виражається як булевий вираз, який приймає значення true або false.
У наступному прикладі обмежання СНЕСК визначає для стовпця CITY множину можливих значень і обмежує діапазон можливих значень стовпця Badge (номер службовця):
CREATE TABLE Employee
(Name CHAR(20),
id_DEP INT,
CITY VARCHAR(20)
CHECK (CITY IN (‘London’, ‘Paris’, ‘Rome’, ‘Athens’)),
Badge INT CHECK (Badge<100));
Додамо обмеження для поля номерів телефонів, таке щоб всі вони починалися з одного коду міста (415) та відповідали певному зразку. При цьому залишимо без перевірки ті поля, для яких вже були введені значення, навіть якщо вони не відповідають зразку:
ALTER TABLE myfriends
WITH NOCHECK
ADD CONSTRAINT friends_chk_num CHECK
(pho ne LIKE ‘(415)[0-9] [0-9][0-9] – [0-9][0-9][0-9][0-9]’);
Обмежання DEFAULT (значення за замовчуванням)
Коли ви вставляєте новий рядок у таблицю без вказання одного чи декількох значень чи при введені інформації залишаєте незаповненими поля, SQL повинен мати значення за замовчуванням для заповнення цих пропусків. Найбільш загальним значенням за замовчуванням є — NULL. Це значення за замовчуванням для будь-якого стовпця, якому не надано обмеження NOT NULL.
Значенння DEFAULT вказується в команді CREATE TABLE у той самий спосіб що і обмеження стовпця, хоча, з технічної точки зору, воно не має обмежуючих властивостей — воно не обмежує значення, які можнае вводити, а просто визначає, що може статися, якщо не ввести будь-яке з них. В якості обмеження обирають значення, що найчастіше зустрічається у стопці. Наприклад, в таблиці службовці, більшість робітників з Лондона, тому саме назву цього міста можна обрати значенням за замовчуванням для стовпця СІТУ:
CREATE TABLE Employee
(Name CHAR(20),
id_DEP INT,
CITY VARCHAR(20) DEFAULT ‘London’,
Badge INT CHECK (Badge<100));