Hiển thị các bài đăng có nhãn Backup. Hiển thị tất cả bài đăng
Hiển thị các bài đăng có nhãn Backup. Hiển thị tất cả bài đăng

Chủ Nhật, 23 tháng 10, 2011

Transact SQL

Giới Thiệu Sơ Lược Về Transact SQL (T-SQL)

Transact-SQL là ngôn ngữ SQL mở rộng dựa trên SQL chuẩn của ISO (International Organization for Standardization) và ANSI (American National Standards Institute) được sử dụng trong SQL Server khác với P-SQL (Procedural-SQL) dùng trong Oracle.

Trong bài này chúng ta sẽ tìm hiểu sơ qua về T-SQL. Chúng được chia làm 3 nhóm:

Data Definition Language (DDL):


Ðây là những lệnh dùng để quản lý các thuộc tính của một database như định nghĩa các hàng hoặc cột của một table, hay vị trí data file của một database...thường có dạng
Create object_Name
Alter object_Name
Drop object_Name


Trong đó object_Name có thể là một table, view, stored procedure, indexes...

Ví dụ:

Lệnh Create sau sẽ tạo ra một table tên Importers với 3 cột CompanyID,CompanyName,Contact

USE Northwind CREATE TABLE Importers( CompanyID int NOT NULL, CompanyName varchar(40) NOT NULL, Contact varchar(40) NOT NULL )


Lệnh Alter sau đây cho phép ta thay đổi định nghĩa của một table như thêm(hay bớt) một cột hay một Constraint...Trong ví dụ này ta sẽ thêm cột ContactTitle vào table Importers

USE Northwind ALTER TABLE Importers ADD ContactTitle varchar(20) NULL





Lệnh Drop sau đây sẽ hoàn toàn xóa table khỏi database nghĩa là cả định nghĩa của table và data bên trong table đều biến mất (khác với lệnh Delete chỉ xóa data nhưng table vẫn tồn tại).

USE Northwind DROP TABLE Importers


Data Control Language (DCL):


Ðây là những lệnh quản lý các quyền truy cập lên từng object (table, view, stored procedure...). Thường có dạng sau:
  • Grant 
  • Revoke 
  • Deny 
Ví dụ:


Lệnh sau sẽ cho phép user trong Public Role được quyền Select đối với table Customer trong database Northwind (Role là một khái niệm giống như Windows Group sẽ được bàn kỹ trong phần Security)

USE Northwind GRANT SELECT ON Customers TO PUBLIC

Lệnh sau sẽ từ chối quyền Select đối với table Customer trong database Northwind của các user trong Public Role

USE Northwind DENY SELECT ON Customers TO PUBLIC

Lệnh sau sẽ xóa bỏ tác dụng của các quyền được cho phép hay từ chối trước đó

USE Northwind REVOKE SELECT ON Customers TO PUBLIC

Data Manipulation Language (DML):

Ðây là những lệnh phổ biến dùng để xử lý data như Select, Update, Insert, Delete


Ví dụ:

Select

USE Northwind SELECT CustomerID, CompanyName, ContactName FROM Customers WHERE (CustomerID = 'alfki' OR CustomerID = 'anatr') ORDER BY ContactName


Insert

USE Northwind INSERT INTO Territories VALUES (98101, 'Seattle', 2)


Update

USE Northwind UPDATE Territories SET TerritoryDescription = 'Downtown Seattle' WHERE TerritoryID = 98101



Delete

USE Northwind DELETE FROM Territories WHERE TerritoryID = 98101



Vì phần này khá căn bản nên chúng tôi thiết nghĩ không cần giải thích nhiều. Chú ý trong lệnh Delete bạn có thể có chữ From hay không đều được.


Nhưng mà chúng ta sẽ chạy thử các ví dụ trên ở đâu?


Ðể chạy các câu lệnh thí dụ ở trên bạn cần sử dụng và làm quen với Query Analyser




Cú Pháp Của T-SQL:

Phần này chúng ta sẽ bàn về các thành phần tạo nên cú pháp của T-SQL

Identifiers

Ðây chính là tên của các database object. Nó dùng để xác định một object. (Chú ý khi nói đến Object trong SQL Server là chúng ta muốn đề cập đến table, view, stored procedure, index.....Vì hầu như mọi thứ trong SQL Server đều được thiết kế theo kiểu hướng đối tượng (object-oriented)). Trong ví dụ sau TableX, KeyCol, Description là những identifiers

CREATE TABLE TableX (KeyCol INT PRIMARY KEY, Description NVARCHAR(80))


Có hai loại Identifiers một loại thông thường (Regular Identifier) và một loại gọi là Delimited Identifier, loại này cần có dấu "" hay dấu [] để ngăn cách. Loại Delimited được dùng đối với các chữ trùng với từ khóa của SQL Server (reserved keyword) hay các chữ có khoảng trống.


Ví dụ:

SELECT * FROM [My Table] WHERE [Order] = 10

Trong ví dụ trên chữ Order trùng với keyword Order nên cần đặt trong dấu ngoặc vuông [].

Variables (Biến)


Biến trong T-SQL cũng có chức năng tương tự như trong các ngôn ngữ lập trình khác nghĩa là cần khai báo trước loại dữ liệu trước khi sử dụng. Biến được bắt đầu bằng dấu @ (Ðối với các global variable thì có hai dấu @@)


Ví dụ:

USE Northwind DECLARE @EmpIDVar INT SET @EmpIDVar = 3 SELECT * FROM Employees WHERE EmployeeID = @EmpIDVar + 1

Functions (Hàm)


Có 2 loại hàm một loại là built-in và một loại user-defined


Các hàm Built-In được chia làm 3 nhóm:
Rowset Functions : Loại này thường trả về một object và được đối xử như một table. Ví dụ như hàm OPENQUERY sẽ trả về một recordset và có thể đứng vị trí của một table trong câu lệnh Select.
Aggregate Functions : Loại này làm việc trên một số giá trị và trả về một giá trị đơn hay là các giá trị tổng. Ví dụ như hàm AVG sẽ trả về giá trị trung bình của một cột.
Scalar Functions : Loại này làm việc trên một giá trị đơn và trả về một giá trị đơn. Trong loại này lại chia làm nhiều loại nhỏ như các hàm về toán học, về thời gian, xử lý kiểu dữ liệu String....Ví dụ như hàm MONTH('2002-09-30') sẽ trả về tháng 9.


Các hàm User-Defined (được tạo ra bởi câu lệnh CREATE FUNCTION và phần body thường được gói trong cặp lệnh BEGIN...END) cũng được chia làm các nhóm như sau:
Scalar Functions : Loại này cũng trả về một giá trị đơn bằng câu lệnh RETURNS.
Table Functions : Loại này trả về một table

Data Type (Loại Dữ Liệu)

Các loại dữ liệu trong SQL Server sẽ được bàn kỹ trong các bài sau

Expressions

Các Expressions có dạng Identifier + Operators (như +,-,*,/,=...) + Value

Các thành phần Control-Of Flow

Như BEGIN...END, BREAK, CONTINUE, GOTO, IF...ELSE, RETURN, WHILE.... Xin xem thêm Books Online để biết thêm về các thành phần này.

Comments (Chú Thích)

T-SQL dùng dấu -- để đánh dấu phần chú thích cho câu lệnh đơn và dùng /*...*/ để chú thích cho một nhóm


Thực Thi Các Câu Lệnh SQL

Thực thi một câu lệnh đơn:

Một câu lệnh SQL được phân ra thành các thành phần cú pháp như trên bởi một parser, sau đó SQL Optimizer (một bộ phận quan trọng của SQL Server) sẽ phân tích và tìm cách thực thi (Execute Plan) tối ưu nhất ví dụ như cách nào nhanh và tốn ít tài nguyên của máy nhất... và sau đó SQL Server Engine sẽ thực thi và trả về kết quả.

Thực Thi một nhóm lệnh (Batches)


Khi thực thi một nhóm lệnh SQL Server sẽ phân tích và tìm biện pháp tối ưu cho các câu lệnh như một câu lệnh đơn và chứa execution plan đã được biên dịch (compiled) trong bộ nhớ sau đó nếu nhóm lệnh trên được gọi lại lần nữa thì SQL Server không cần biên dịch mà có thể thực thi ngay điều này giúp cho một batch chạy nhanh hơn.


Lệnh GO


Lệnh này chỉ dùng để gởi một tín hiệu cho SQL Server biết đã kết thúc một batch job và yêu cầu thực thi. Nó vốn không phải là một lệnh trong T-SQL.


Tóm lại trong phần này chúng ta đã tìm hiểu về Transact- SQL là ngôn ngữ chính để giao tiếp với SQL Server. Trong bài sau chúng ta sẽ tiếp tục bàn về cấu trúc bên trong của SQL Server .

Backup And Restore SQL Server

Chiến Lược Phục Hồi Dữ Liệu (Data Restoration Strategy)


Có một điều mà chúng ta phải chú ý là hầu như bất kỳ database nào cũng cần được phục hồi vào một lúc nào đó trong suốt chu kỳ sống của nó. Là một người Database Administrator bạn cần phải giảm tối đa số lần phải phục hồi dữ liệu, luôn theo dõi, kiểm tra thường xuyên để phát hiện các trục trặc trước khi nó xảy ra. Phải dự phòng các biến cố có thể xảy ra và bảo đảm rằng có thể nhanh chóng phục hồi dữ liệu trong thời gian sớm nhất có thể được.

Các dạng biến cố hay tai họa có thể xảy ra là:
  • Ðĩa chứa data file hay Transaction Log File hay system file bị mất
  • Server bị hư hỏng
  • Những thảm họa tự nhiên như bão lụt, động đất, hỏa hoạn
  • Toàn bộ server bị đánh cắp hoặc phá hủy
  • Các thiết bị dùng để backup - restore bị đánh cắp hay hư hỏng
  • Những lỗi do vô ý của user như lỡ tay delete toàn bộ table chẳng hạn
  • Những hành vi mang tính phá hoại của nhân viên như cố ý đưa vào những thông tin sai lạc.
  • Bị hack (nếu server có kết nối với internet).Bạn phải tự hỏi khi các vấn đề trên xảy ra thì bạn sẽ làm gì và phải luôn có biện pháp đề phòng cụ thể cho từng trường hợp cụ thể. Ngoài ra bạn phải xác định thời gian tối thiểu cần phục hồi dữ liệu và đưa server trở lại hoạt động bình thường.
Các Loại Backup
Ðể có thể hiểu các kiểu phục hồi dữ liệu khác nhau bạn phải biết qua các loại backup trong SQL Server
  • Full Database Backups : Copy tất cả data files trong một database . Tất cả những user data và database objects như system tables, indexes, user-defined tables đều được backup.
  • Differential Database Backups : Copy những thay đổi trong tất cả data files kể từ lần full backup gần nhất.
  • File or File Group Backups : Copy một data file đơn hay một file group.
  • Differential File or File Group Backups : Tương tự như differential database backup nhưng chỉ copy những thay đổi trong data file đơn hay một file group.Transaction Log Backups : Ghi nhận một cách thứ tự tất cả các transactions chứa trong transaction log file kể từ lần transaction log backup gần nhất. Loại backup này cho phép ta phục hồi dữ liệu trở ngược lại vào một thời điểm nào đó trong quá khứ mà vẫn đảm bảo tính đồng nhất (consistent).
Trong lúc backup SQL Server cũng copy tất cả các hoạt động của database kể cả hoạt động xảy ra trong quá trình backup cho nên ta có thể backup trong khi SQL đang chạy mà không cần phải ngưng lại.
Recovery Models
  • Full Recovery Model : Ðây là model cho phép phục hồi dữ liệu với ít rủi ro nhất. Nếu một database ở trong mode này thì tất cả các hoạt động không chỉ insert, update, delete mà kể cả insert bằng Bulk Insert, hay bcp đều được log vào transaction log file. Khi có sự cố thì ta có thể phục hồi lại dữ liệu ngược trở lại tới một thời điểm trong quá khứ. Khi data file bị hư nếu ta có thể backup được transaction log file thì ta có thể phục hồi database đến thời điểm transaction gần nhất được commited.
  • Bulk-Logged Recovery Model : Ở mode này các hoạt động mang tính hàng loạt như Bulk Insert, bcp, Create Index, WriteText, UpdateText chỉ được log minimum vào transaction log file đủ để cho biết là các hoạt động này có diễn ra mà không log toàn bộ chi tiết như trong Full Recovery Mode. Các hoạt động khác như Insert, Update, Delete vẫn được log đầy đủ để dùng cho việc phục hồi sau này.
  • Simple Recovery Model : Ở mode này thì Transaction Log File được truncate thường xuyên và không cần backup. Với mode này bạn chỉ có thể phục hồi tới thời điểm backup gần nhất mà không thể phục hồi tới một thời điểm trong quá khứ.

Muốn biết database của bạn đang ở mode nào bạn có thể Right-click lên một database nào đó trong SQL Server Enterprise Manager chọn Properties->Options->Recovery



Tuy nhiên có thể tới đây bạn cảm thấy rất khó hiểu về những điều trình bày ở trên. Chúng ta hãy dùng một ví dụ sau để làm rõ vấn đề.


Ví dụ:

Chúng ta có một database được áp dụng chiến lược backup như hình vẽ sau:




Trong ví dụ này ta schedule một Full Database Backup vào ngày Chủ Nhật và Differential Backup vào các ngày thứ Ba và Thứ Năm. Transaction Log Backup được schedule hằng ngày. Vào một ngày Thứ Sáu "đen tối" một sự cố xảy ra đó là đĩa chứa data file của database bị hư và là một DBA bạn được yêu cầu phải phục hồi dữ liệu và đưa database trở lại hoạt động bình thường. Bạn phải làm sao?


Trước hết bạn phải backup ngay Transaction Log File (Trong ví dụ này Transaction Log File được chứa trong một đĩa khác với đĩa chứa Data File nên không bị hư và vẫn còn hoạt động). Người ta còn gọi file backup trong trường hợp này là " the tail of the log" (cái đuôi). Nếu Log File được chứa trên cùng một đĩa với Data file thì bạn có thể sẽ không backup được "cái đuôi" và như vậy bạn phải dùng đến log file backup gần nhất. Khi backup "cái đuôi" này bạn cần phải dùng option NO_TRUNCATE bởi vì thông thường các Transaction Log Backup sẽ truncate(xoá) những phần không cần dùng đến trong transaction log file, đó là những transaction đã được commited và đã được viết vào database (còn gọi là inactive portion of the transaction log) để giảm kích thước của log file. Tuy nhiên khi backup phần đuôi không được truncate để đảm bảo tính consistent (nhất quán) của database.


Kế đến bạn phải restore database từ Full Backup File của ngày Chủ Nhật. Nó sẽ làm 2 chuyện : copy data, log, index... từ đĩa backup vào Data Files và sau đó sẽ lần lượt thực thi các transaction trong transaction log. Lưu ý ta phải dùng option WITH NORECOVERY trong trường hợp này (tức là option thứ 2 "Leave database nonoperational but able to restore additional transaction logs" trong Enterprise Manager). Nghĩa là các transaction chưa hoàn tất (incomplete transaction) sẽ không được roll back. Như vậy database lúc này sẽ ở trong tình trạng inconsistent và không thể dùng được. Nếu ta chọn WITH RECOVERY (hay "Leave database operational. No additional transaction logs can be restored " trong Enterprise Manager) thì các incomplete transaction sẽ được roll back và database ở trạng thái consistent nhưng ta không thể nào restore các transaction log backup được nữa.


Tiếp theo bạn phải restore Differential Backup của ngày Thứ Năm. Sau đó lần lượt restore các Transaction Log Backup kể từ sau lần Differential Backup cuối cùng nghĩa là restore Transaction Log Backup của ngày Thứ Năm và "Cái Ðuôi". Như vậy ta có thể phục hồi data trở về trạng thái trước khi biến cố xảy ra. Quá trình này gọi là Database Recovery.


Cũng xin làm rõ cách dùng từ Database Restoration và Database Recovery trong SQL Server. Hai từ này nếu dịch ra tiếng Việt đều có nghĩa là phục hồi cơ sở dữ liệu nhưng khi đọc sách tiếng Anh phải cẩn thận vì nó có nghĩa hơi khác nhau.


Như trong ví dụ trên Khi ta restore database từ một file backup nghĩa là chỉ đơn giản tái tạo lại database từ những file backup và thực thi lại những transaction đã được commit nhưng database có thể ở trong trạng thái inconsistent và không sử dụng được. Nhưng khi nói đến recover nghĩa là ta không chỉ phục hồi lại data mà còn bảo đảm cho nó ở trạng thái consistent và sử dụng được (usable).

Có thể bạn sẽ hỏi consistent là thế nào? Phần này sẽ được nói rõ trong bài sau về Data Integrity. Nhưng cũng xin dùng một ví dụ đơn giản để giải thích. Trong ví dụ về thế nào là một transaction ở bài 3 : Giả sử số tiền $500 được trừ khỏi account A nhưng lại không được cộng vào account B và nếu database không được quá trình khôi phục dữ liệu tự động (automatic recovery process) của SQL rollback thì nó sẽ ở trạng thái inconsistent. Nếu database ở trạng thái giống như trước khi trừ tiền hoặc sau khi đã cộng $500 thành công vào account B thì gọi là consistent.

Cho nên việc backup Transaction Log File sẽ giúp cho việc recovery data tới bất kỳ thời điểm nào trong quá khứ. Ðối với Simple Recovery Model ta chỉ có thể recover tới lần backup gần nhất mà thôi.

Như vậy khi restore database ta có thể chọn option WITH RECOVERY để roll back các transaction chưa được commited và database có thể hoạt động bình thường nhưng ta không thể restore thêm backup file nào nữa, thường option này được chọn khi restore file backup cuối cùng trong chuỗi backup. Nếu chọn option WITH NORECOVERY các transaction chưa được commited sẽ không được roll back do đó SQL Server sẽ không cho phép ta sử dụng database nhưng ta có thể tiếp tục restore các file backup kế tiếp, thường option này được chọn khi sau đó ta còn phải restore các file backup khác.

Không lẽ chỉ có thể chọn một trong hai option trên mà thôi hay sao? Không hoàn toàn như vậy ta có thể chọn một option trung lập hơn là option WITH STANDBY (tức là option 3 "Leave database read-only and able to restore additional transaction logs" trong Enterprise Manager). Với option này ta sẽ có luôn đặc tính của hai option trên : các incomplete transaction sẽ được roll back để đảm bảo database consistent và có thể sử dụng được nhưng chỉ dưới dạng Read-only mà thôi, đồng thời sau đó ta có thể tiếp tục restore các file backup còn lại (SQL Server sẽ log các transaction được roll back trong undo log file và khi ta restore backup file kế tiếp SQL Server sẽ trả lại trạng thái no recovery từ những gì ghi trên undo file). Người ta dùng option này khi muốn restore database trở lại một thời điểm nào đó (a point in time) nhưng không rõ là đó có phải là thời điểm mà họ muốn không, cho nên họ sẽ restore từng backup file ở dạng Standby và kiểm chứng một số data xem đó có phải là thời điểm mà họ muốn restore hay không (chẳng hạn như trước khi bị delete hay trước khi một transaction nào đó được thực thi) trước khi chuyển sang Recovery option.
Backup Database
Trong phần này chúng ta sẽ bàn về cách backup database. Nhưng trước hết chúng ta hãy làm quen với một số thuật ngữ dùng trong quá trình backup và restore. Có những từ ta sẽ để nguyên tiếng Anh mà không dịch.
Thuật Ngữ
Giải Thích
Backup
Quá trình copy toàn bộ hay một phần của database, transaction log, file hay file group
 hình thành một backup set. Backup set được chứa trên backup media (tape or disk)
 bằng cách sử dụng một backup device (tape drive name hay physical filename)
Backup Device
Một file vật lý (như C:\SQLBackups\Full.bak) hay tape drive cụ thể (như \\.\Tape0)
 dùng để record một backup vào một  backup media.
Backup File
File chứa một backup set
Backup Media
Disk hay tape được sử dụng để chứa một backup set. Backup media có thể chứa
 nhiều backup sets (ví dụ như từ nhiều SQL Server 2000 backups và từ nhiều Windows 2000 backups).
Backup Set
Một bộ backup từ một lần backup đơn được chứa trên backup media.


Chúng ta có thể tạo một backup device cố định (permanent) hay tạo ra một backup file mới cho mỗi lần backup. Thông thường chúng ta sẽ tạo một backup device cố định để có thể dùng đi dùng lại đặc biệt cho việc tự động hóa công việc backup. Ðể tạo một backup device dùng Enterprise Manager bạn chọn Management->Backup rồi Right-click->New

Backup Device. Ngoài ra bạn có thể dùng sp_addumpdevice system stored procedure như ví dụ sau:



USE Master Go Sp_addumpdevice 'disk' ,
 'FullBackupDevice' ,
 'E:\SQLBackups\Full.bak'



Ðể backup database bạn có thể dùng Backup Wizard hoặc click lên trên database muốn backup sau đó Right-click->All Tasks->Backup Database... sẽ hiện ra window như hình vẽ sau:


Sau đó dựa tùy theo yêu cầu của database mà chọn các option thích hợp. Ta có thể schedule cho SQL Server backup định kỳ.


Restore Database

Trước khi restore database ta phải xác định được thứ tự file cần restore. Các thông tin này được SQL Server chứa trong msdbdatabase và sẽ cho ta biết backup device nào, ai backup vào thời điểm nào. Sau đó ta tiến hành restore. Ðể restore bạn Right-click->All Tasks->Restore database... sẽ thấy window như hình vẽ sau:


Nếu bạn restore từ một instance khác của SQL Server hay từ một server khác bạn có chọn From device option và chọn backup device (file backup) tương ứng .

Lưu ý nếu bạn muốn overwrite database có sẵn với data được backup bạn có thể chọn option Force restore over existing database như hình vẽ sau:




Bạn có thể chọn leave database operational hay nonoperational tùy theo trường hợp như đã giải thích ở trên.
Tóm lại trong bài này chúng ta đã tìm hiểu một chút lý thuyết về backup và restore database trong SQL Server. Ðể có thể hiểu rõ hơn bạn cần phải thực tập hay làm thử để có thêm kinh nghiệm. Trong bài sau chúng ta sẽ bàn về đề tài Data Integrity nghĩa là làm sao để đảm bảo data chứa trong database là đáng tin cậy và không bị "lũng lỗ" như cách nói bình dân mà tôi thường hay dùng.
DBS M05479
Quang Cao