Regular expression

RE là một ngôn ngữ cực mạnh dùng mô tả văn bản cũng như thao tác trên văn bản. Một RE thường được ứng dụng lên một chuỗi, nghĩa là lên một nhóm ký tự. Chẳng hạn, ta có chuỗi sau: Mot, Hai, Ba, Bon, NEVERLAND. | 1. Giới thiệu RE là một ngôn ngữ cực mạnh dùng mô tả văn bản cũng như thao tác trên văn bản. Một RE thường được ứng dụng lên một chuỗi nghĩa là lên một nhóm ký tự. Chẳng hạn ta có chuỗi sau Mot Hai Ba Bon NEVERLAND. Bạn có thể trả về bất cứ hoặc tất cả các chuỗi con của nó Hai hoặc Bốn chẳng hạn hoặc thay đổi phiên bản của những chuỗi con của nó Mộtt hoặc Bốn chẳng hạn . Một RE là một kiểu mẫu văn bản gồm 2 phần literal trực kiện và metacharacters ký tự siêu . Một literal đơn thuần chỉ là một ký tự a-z mà bạn muốn đem so khớp với chuỗi đích. Metacharacters là một ký tự đặc biệt hoạt động như là 1 mệnh lệnh đối với bộ phận phân tích ngữ nghĩa parser của RE Bây giờ chúng ta thử tạo một regular expression như sau Á From To Subject Date RE này sẽ khớp với bất cứ chuỗi con nào miễn là chuỗi này là một hàng mới bắt đầu với From hoặc To hoặc các chữ Subject hoặc Date Dấu A nghĩa là bắt đầu 1 hàng mới chuỗi này kết thúc bởi dấu hai chấm . Dấu A cho bộ parser của RE biết chuỗi mà ban đang truy tìm phải bắt đầu bởi một hàng mới. Các chữ From To . là những literal và những metacharacter và được dùng để tạo nhóm literal và cho biết bất cứ những lựa chọn nào cũng phải khớp. Dấu A cũng là metacharacter nó cho biết là khởi đầu 1 hàng. Do đó bạn đọc hàng sau đây Á From To Subject Date Như sau cho khớp bất cứ chuỗi con nào bắt đầu bởi một hàng mới theo sau bởi bất cứ 4 chuỗi literal From To Subject và Date rồi theo sau bởi dấu hai chấm 2. Các ký tự siêu thường dùng vô cùng quan trọng cần phải nắm . đại diện cho 1 ký tự bất kỳ trừ ký tự xuống dòng n. d ký tự chữ số tương đương 0-9 D ký tự ko phải chữ số s ký tự khoảng trắng tương đương f n r t v S ký tự không phải khoảng trắng tương đương A f n r t v w ký tự word gồm chữ cái và chữ số dấu gạch dưới _ tương đương a-zA-Z_0-9 W ký tự không phải ký tự word tương đương Aa-zA-Z_0-9 A bắt đầu 1 chuỗi hay 1 dòng kết thúc 1 chuỗi hay 1 dòng Biên tập thienthanit@ Nguồn Internet c Co Bản A bắt đầu 1 .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.