Blog - Trang 1 - VNOJ: VNOI Online Judge

Blog - Trang 1

Khái lược nghệ thuật nhồi cấu trúc

gigajet đã đăng vào 19, Tháng 4, 2025, 14:05

Khái lược nghệ thuật nhồi cấu trúc

Khái lược bài viết "The Lost Art of Structure Packing" của Eric S. Raymond. Người viết không dịch toàn bộ mà tóm lại những phần bản thân cho là quan trọng.

Tiêu chuẩn về căn chỉnh

Trên các bộ xử lý hiện đại, trình biên dịch phải sắp đặt các kiểu dữ liệu căn bản trong bộ nhớ để đọc ghi được nhanh hơn.
Do tiêu chuẩn này mà lớp lớn các kiến trúc tập lệnh (ISA) từ Intel, tới ARM, tới RISC-V, đều sắp đặt cùng một cách.
Trong C, mỗi biến dữ liệu kiểu căn bản cần tuân theo yêu cầu căn chỉnh là: một short 2 byte phải bắt đầu ở địa chỉ chẵn, một int hay float 4 byte phải bắt đầu ở địa chỉ chia hết cho 4, và một long hay double 8 byte phải bắt đầu ở địa chỉ chia hết cho 8. signed hay unsigned đều vậy. Con trỏ, tùy theo cỡ của nó là 32-bit hay 64-bit, cũng được căn chỉnh tương ứng theo 4 byte hoặc 8 byte. Đây gọi là tính tự căn chỉnh.
Phần cứng có cách căn chỉnh khác với tính tự căn chỉnh rất là hiếm, gần như không tồn tại hoặc quá cũ và quá đặc thù trong nhóm nhỏ. Trừ khi cần quan tâm đặc biệt tới phần cứng đặc thù, có thể giả định đại đa số phần cứng đều có tính tự căn chỉnh để căn chỉnh kiểu dữ liệu.

Padding, tức căn lề

Tuy tài liệu tiêu chuẩn C không bắt buộc rằng các biến tĩnh được sắp đặt theo thứ tự được viết ra trong mã nguồn (tức mặc định là trình biên dịch được đổi chỗ các biến toàn cục), nhưng các trình biên dịch như gcc và clang thường làm như vậy, sắp theo mã nguồn, nên ít khi ta cần quan tâm, trừ khi làm việc với trình biên dịch đặc biệt nào đó.
Cho nên giả định khai báo sau ở biến toàn cục:

char *p;
char c;
int x;

thì để thỏa tính tự căn chỉnh cho x, bộ nhớ được sắp đặt như vầy trong máy 32-bit:

char *p;    /* 4 byte */
char c;     /* 1 byte */
char pad[3];
int x;      /* 4 byte */

Trong đây pad là biến tượng trưng cho phần lề được căn chỉnh để thỏa tính tự căn chỉnh của biến. Đây là bộ nhớ bị lãng phí. Còn nếu là

char *p;
char c;
short x;

thì sự sắp đặt là như vầy:

char *p;    /* 4 byte */
char c;     /* 1 byte */
char pad[1];/* 1 byte */
short x;    /* 2 byte */

Nếu x là kiểu có 8 bytes (như long trên máy 64-bit) thì sẽ có 7 bytes pad.

Ở trường hợp khó đoán hơn như vầy thì sao:

char c;
char *p;
int x;

nếu gọi các lề là pad1 và pad2 và viết sự sắp đặt bộ nhớ thành:

char c;         /* 1 byte */
char pad1[M];
char *p;        /* 8 byte */
char pad2[N];
int x;          /* 4 byte */

thì M và N bằng bao nhiêu?

N bằng không. Bởi vì kiểu con trỏ (4 hoặc 8 byte) luôn có yêu cầu tự căn chỉnh nghiêm ngặt hơn kiểu int (4 byte). Nhưng M khó đoán hơn vì vốn c (1 byte) không cần tự căn chỉnh nên không biết trình biên dịch đặt c ở đâu. Nếu c được đặt ở byte cuối cùng của word (word là độ lớn của thanh ghi đa năng) thì M bằng không, nhưng xác suất cao hơn là c được đặt ở byte đầu tiên của word, lúc này M bằng 3 trên máy 32-bit và bằng 7 trên máy 64-bit, và các trường hợp M từ 1 tới 2 trên máy 32-bit và từ 1 tới 6 trên máy 64-bit cũng có thể xảy ra, có thể do các biến toàn cục khác được khai báo liền trước đó.

Đối với mảng của kiểu căn bản, vì các phần tử đều tự căn chỉnh, nên chúng không cần thêm điều kiện căn chỉnh nào khác. Các phần tử sắp xếp liền nhau không có thêm khoảng trống nào giữa các phần tử.
Vậy với struct thì khác biệt chỗ nào?

Căn chỉnh và căn lề trong cấu trúc `struct`

Một biến kiểu struct được căn chỉnh theo trường có kiểu căn bản rộng nhất. Tức là nếu trong struct kiểu căn bản rộng nhất là 4 byte, thì struct phải bắt đầu ở địa chỉ chia hết cho 4, còn nếu có trường căn bản lớn nhất là 8 byte, thì phải bắt đầu ở địa chỉ chia hết cho 8. Trong C, địa chỉ của struct cũng là địa chỉ của trường đầu tiên, trong C++ thì không chắc vì còn tùy theo có kế thừa và có hàm ảo hay không.
Vì ta biết struct được căn chỉnh theo trường căn bản rộng nhất, cho nên với khai báo biến tĩnh rời nhau như vầy ở máy 64-bit như cuối phần trước

char c;     /* 1 byte */
char *p;    /* 8 byte */
int x;      /* 4 byte */

thì ta không biết phần lề giữa c và p là bao nhiêu byte, nhưng nếu khai báo cùng một struct nhưng vầy

struct foo {
    char c; /* 1 byte */
    char pad[7]; /* 7 byte */
    char *p; /* 8 byte */
    int x; /* 4 byte */
};

thì ta biết chắc pad gồm 7 byte, bởi vì địa chỉ của một biến struct foo phải được căn theo trường căn bản rộng nhất là p gồm 8 byte, nên phải có địa chỉ chia hết cho 8. c là trường đầu tiên của struct foo nên có cùng địa chỉ với biến struct foo, nên cũng có địa chỉ chia hết cho 8, tức nằm ở byte đầu tiên của word, mà như vậy thì cần có 7 byte phần lề trước khi sắp đặt p.

struct có thể có thêm phần lề ở cuối, dựa trên địa chỉ sải chân, còn gọi là stride address, của struct đó. Địa chỉ sải chân là địa chỉ đầu tiên đằng sau một struct có cùng độ căn chỉnh với struct đó. Trình biên dịch sẽ làm theo luật là đệm thêm phần lề vào sau một struct cho tới ngay trước địa chỉ sải chân của struct đó. Luật này quyết định sizeof() trả về cái gì.
Cho nên, xét ví dụ sau trên máy 64-bit

struct foo3 {
    char *p;     /* 8 byte */
    char c;      /* 1 byte */
};

struct foo3 singleton;
struct foo3 quad[4];

thì foo3 được căn chỉnh theo 8 byte (vì trường căn bản rộng nhất là p gồm 8 byte). Tuy nhiên thay vì 9 bytes thì sizeof(struct foo3) bằng 16 byte, bởi vì địa chỉ sải chân của struct foo3 là 16, vì 16 là số nhỏ nhất sau 9 mà chia hết cho 8. Cho nên 7 byte từ offset 9 tới offset 15 trở thành lề của struct foo3. Vậy biến singleton cũng như các phần tử của mảng quad đều bằng 16 bytes. Nói cách khác, có thể viết lại struct foo3 thêm các phần lề pad như sau:

struct foo3 {
    char *p;     /* 8 byte */
    char c;      /* 1 byte */
    char pad[7];
};

Còn đối với ví dụ này

struct foo4 {
    short s;     /* 2 byte */
    char c;      /* 1 byte */
};

thì struct foo4 không có phần lề giữa các phần tử, và có phần lề cuối là 1 byte, sizeof(struct foo4) cũng như địa chỉ sải chân là 4 (bạn đọc hãy xem tại sao).

Nếu struct được khai báo lồng nhau thì mỗi struct bên trong được tự căn chỉnh theo chính nó, và các trường của struct bên trong cũng ảnh hưởng tới độ căn chỉnh của struct bên ngoài, chứ không chỉ các trường trực tiếp của struct bên ngoài. Chẳng hạn trong máy 64 bit có khai báo này

struct foo5 {
    char c;
    struct foo5_inner {
        char *p;
        short x;
    } inner;
};

thì ta thấy sizeof(struct foo5_inner) bằng 16. Và struct foo5 được căn chỉnh theo 8 byte (trường căn bản dài nhất là p của inner), cho nên giữa c và inner có phần lề 7 byte, và không cần phần lề sau vì địa chỉ sải chân vừa bằng 24, viết lại thêm các phần lề pad1, pad2 như sau:

struct foo5 {
    char c;           /* 1 byte */
    char pad1[7];     /* 7 byte */
    struct foo5_inner {
        char *p;      /* 8 byte */
        short x;      /* 2 byte */
        char pad2[6]; /* 6 byte */
    } inner;
};

Vì sizeof(struct foo5) bằng 24, và có 13 bit trong đó là phần lề, ta thấy hơn 50% bộ nhớ bị lãng phí!

Xét thêm một ví dụ khác, với khai báo sau trên máy 64-bit:

struct foo5x {
    char c;
    struct foo5x_inner {
        char *p;
        short x;
    } inner;
    char d;
};

thì sizeof(struct foo5x)=32 viết lại thêm các phần lề (bắt đầu bằng) pad được

struct foo5x {
    char c;
    char pad1[7];
    struct foo5x_inner {
        char *p;
        short x;
        char pad2[6];
    } inner;
    char d;
    char pad3[7];
};

Tỉ lệ bộ nhớ lãng phí là 20/32, tức 62,5%.

Về trường bit (bitfield)

Trường bit cho phép giới hạn độ lớn các trường theo bit (thấp nhất là 1 bit), được cài đặt bằng các phép mặt nạ và xoay bit trên byte và word. Đây là một ví dụ khai báo trường bit.

struct foo6 {
    short s;
    char c;
    int flip:1;
    int nybble:4;
    int septet:7;
};

C99 đảm bảo trường bit được nén chặt nhất có thể, miễn là không vượt quá biên của đơn vị lưu trữ (word). Nhưng C11 và C++14 lỏng lẻo hơn, và trường bit có thể vượt qua biên lưu trữ để trải dài trên nhiều word thay vì bắt đầu word mới, và C11/C++14 cho phép trình biên dịch quyết định chuyện này. Với GCC thì để ABI quyết định, và x64 ABI thì làm giống như C99.
Không có quy định về thứ tự các trường bit là phải từ bit nhỏ nhất tới lớn nhất hay ngược lại, cho nên struct foo6 ở trên máy 32-bit có thể hiểu là

struct foo6 {
    short s;       /* 2 byte */
    char c;        /* 1 byte */
    int flip:1;    /* tổng 1 bit */
    int nybble:4;  /* tổng 5 bit */
    int pad1:3;    /*  phần lề cho đủ 8-bit, bởi vì không đủ chỗ để nhét thêm 7 bit phía sau, do tính từ đầu struct thì word lúc này đã là 3 byte + 5 bit = 29 bit, nên phải cho `septet` qua word mới */
    int septet:7;  /* 7 bit */
    int pad2:25;   /* phần lề cho đủ 32 bit */
};

hoặc phần lề có thể nằm trước các trường bit như sau

struct foo6 {
    short s;       /* 2 byte */
    char c;        /* 1 byte */
    int pad1:3;    /* phần lề cho đủ 8 bit */
    int flip:1;    /* tổng 1 bit */
    int nybble:4;  /* tổng 5 bit, kết thúc word 1 từ đầu struct */
    int pad2:25;   /* phần lề cho `septet` đủ 32 bit */
    int septet:7;  /* 7 bit, kết thúc word 2 */
};

Tiêu chuẩn từ C99 trở đi thì phần lề không chắc sẽ được phủ bằng các byte 00. Còn về kiểu thì khi tính toán, trình biên dịch sẽ hiểu tính có dấu (sign/unsigned) của kiểu nhưng không chắc liệu trình biên dịch quyết định độ lớn như thế nào, liệu đơn vị lưu trữ có bị giữa hai khai báo short flip:1 và long flip:1 hay không, cái này tùy vào trình biên dịch.
Do giới hạn không được lấn qua word khác của C99, struct foo9 dưới đây tốn ba word 32-bit trong C99, mà word cuối cùng chỉ dùng có 1 bit. C11 và C++14 có thể nén struct foo9 chặt hơn, nhưng đừng trông đợi trình biên dịch sẽ làm vậy. Ngoài ra, struct foo8 có thể nằm gọn trong một word 64-bit nếu máy hỗ trợ độ lớn này.

struct foo7 {
    int bigfield:31;      /* bắt đầu 32 bit của word 1 */
    int littlefield:1;
};

struct foo8 {
    int bigfield1:31;     /* bắt đầu 32 bit của word 1 */
    int littlefield1:1;
    int bigfield2:31;     /* bắt đầu 32 bit của word 2 */
    int littlefield2:1;
};

struct foo9 {
    int bigfield1:31;     /* bắt đầu 32 bit của word 1 */
    int bigfield2:31;     /* bắt đầu 32 bit của word 2 */
    int littlefield1:1;
    int littlefield2:1;   /* bắt đầu 32 bit của word 3 */
};

Sắp đặt lại cấu trúc

Từ các hiểu biết trên, ta thấy có thể sắp đặt lại thứ tự các trường để giảm thiểu phần lề bị bỏ phí. Đây là nghệ thuật nhồi cấu trúc. Phần lề chỉ xảy ra ở hai chỗ: một là để lưu trữ kiểu lớn hơn (nên cần tự căn chỉnh với độ lớn lớn hơn), hai là khi một struct kết thúc trước địa chỉ sải chân của nó, dẫn tới phần lề được thêm.
Cách đơn giản nhất là sắp đặt lại các trường giảm dần theo cỡ. Như vậy giảm thiểu nguyên nhân thứ nhất sinh ra phần lề, vì sự thay đổi từ kiểu cỡ nhỏ qua cỡ lớn là ít nhất. Nhưng với kiểu có struct lồng nhau thì chưa chắc sẽ giảm được, do bộ nhớ tiết kiệm được bị chuyển thành phần lề trước địa chỉ sải chân, chẳng hạn như khi áp dụng với struct foo5 ở trên

struct foo12 {
    struct foo5 {
        char *p;      /* 8 byte */
        short x;      /* 2 byte */
    } inner;
    char c;           /* 1 byte*/
};

thì ta thấy sizeof(struct foo12) vẫn là 24 byte:

struct foo12 {
    struct foo5 {
        char *p;      /* 8 byte */
        short x;      /* 2 byte */
        char pad1[6]; /* 6 byte */
    } inner;
    char c;           /* 1 byte*/
    char pad2[7];     /* 7 byte */
};

cho nên cần thiết kế lại cấu trúc nếu muốn giảm cỡ.

Cũng có thể sắp đặt các trường theo thứ tự tăng dần của cỡ sao cho phần lề dồn lên phía trước thay vì phía sau như cách trên. Có thể giảm thiểu phần lề bằng mọi thứ tự được sắp mà, một là, mọi trường cùng cỡ nằm liền nhau (nên không có phần lề nằm giữa chúng), và hai là, các lỗ hổng nằm giữa các dải liền nhau này được sắp sao cho từ cỡ của dải có cỡ nhỏ hơn (cỡ của cả dải, không phải cỡ của độ căn chỉnh), cần ít bước nhân đôi nhất để đến được cỡ của dải liền kề có cỡ lớn hơn. Chẳng hạn như struct foo13 bên dưới không có phần lề nào:

struct foo13 {
    int32_t i;
    int32_t i2;
    char octet[8];
    int32_t i3;
    int32_t i4;
    int64_t l;
    int32_t i5;
    int32_t i6;
};

Ngoài lề, không ảnh hưởng nội dung: vì sao struct foo13 không có phần lề nào được xem như bài tập cho người đọc. Và người viết bài bằng tiếng Việt cũng khuyến khích người đọc hiểu tại sao bằng 2 cách, một là từ định nghĩa luật tự căn chỉnh, hai là từ điều nhận thấy liền trước. Để thấy được bằng cách thứ hai, ta thấy struct foo13 gồm có năm dải (các phần tử liền nhau cùng cỡ) được viết cách ra sau đây cùng với cỡ của mỗi dải trong phần bình luận:

struct foo13 {
    int32_t i;      /* Dải 1: 8 byte */
    int32_t i2;

    char octet[8];  /* Dải 2: 8 byte */

    int32_t i3;     /* Dải 3: 8 byte */
    int32_t i4;

    int64_t l;      /* Dải 4: 8 byte */

    int32_t i5;     /* Dải 5: 8 byte */
    int32_t i6;
};

Như vậy không cần bước nhân đôi nào để đi từ dải này qua dải liền kề kia, nên không có phần lề.

C không tự ý thay đổi thứ tự các trường trong cấu trúc, bởi vì C vốn được dùng để viết hệ điều hành và mã nguồn gắn với phần cứng, cho nên người lập trình hệ thống cần phải sắp đặt cấu trúc để phản ánh chính xác trên bộ nhớ cách sắp đặt byte và bit của thiết bị hòng điều khiển thiết bị ngoại vi một cách trừu tượng bằng sự đọc ghi bộ nhớ thông thường, nên sự không tự sắp thứ tự cũng là một tính năng. Go làm giống C; nhưng Rust thì ngược lại, mặc định thì trình biên dịch được sắp đặt lại thứ tự các trường.

Một số ngoại lệ

Với kiểu enum thì trình biên dịch được tùy ý xem đó là short, long, hay char ở mặc định, cho nên tùy trình biên dịch mới biết được bộ nhớ được sắp đặt ra sao.
long double thì tùy nền tảng, có thể là 80 bit, có thể là 128 bit, có thể là 80 bit nhưng được căn chỉnh phần lề theo 96 hay 128 bit.
double trong x86 Linux có thể tự căn chỉnh theo 4 byte trong khi cỡ của nó là 8 byte nếu biến này nằm trong một struct, nhưng vẫn căn chỉnh theo 8 byte nếu khai bao bên ngoài, tùy trình biên dịch và tùy chọn.
Tóm lại, gặp các trường hợp này nên dùng sizeof() và offsetof() để kiểm tra cỡ lưu trữ.

Tính dễ đọc và tính cục bộ bộ nhớ đêm

Nếu sắp thứ tự một cách máy móc và vụng về có thể làm giảm tính dễ đọc và tính cục bộ bộ nhớ đệm của mã nguồn.
Về tính dễ đọc, nên nhớ rằng mã nguồn còn để cho con người đọc như một bản thiết kế cấu trúc dữ liệu, chứ không chỉ để máy móc biên dịch. Để dễ đọc thì cần gom nhóm các trường dữ liệu liên quan với nhau về ngữ nghĩa, đặt chúng nằm gần nhau. Lý tưởng mà nói, thiết kế của cấu trúc cần phải truyền đạt thiết kế của chương trình.
Về tính cục bộ bộ nhớ đệm, cái mà ta làm để bảo quản tính dễ đọc, tức là gom nhóm những trường liên quan với nhau đặt chúng nằm gần nhau, cũng cải thiên tính cục bộ bộ nhớ đệm, nếu như các trường này thường được đọc ghi cùng nhau. Nên nếu sắp thứ tự một cách máy móc và để chúng xa nhau có thể làm chậm thuật toán do cache miss.
Nếu mã nguồn chạy bằng nhiều tiến trình hay thread, còn có vấn đề thứ ba là cache line bouncing. Để giảm thiểu thời gian đọc ghi bTính dễ đọcus đắt đỏ, cần giảm thiểu chuyện đọc từ cache line này và ghi ra cache line khác trong một vòng lặp.
Tóm lại, cần xem xét một số rủi ro ở trên khi đưa ra quyết định sắp lại thứ tự của trường.

Cẩn thận khi dùng trường bit và union để tiết kiệm bộ nhớ.

Một số công cụ có thể tham khảo thêm, nghe đồn

pahole

gigajet

o19, Tháng 4, 2025, 14:05 0

Phát triển chương trình bằng cách tinh chế từng bước

gigajet đã đăng vào 15, Tháng 1, 2025, 16:00

Phát triển chương trình bằng cách tinh chế từng bước

Bản dịch không chính thức bài luận "Program Development by Stepwise Refinement" của tác giả Niklaus Wirth, xuất bản năm 1971. Người dịch có chỉnh sửa một số thứ cho hợp thời đại, sự thay đổi (hy vọng sẽ) được ghi tường minh, sửa văn phong trang trọng và cách dùng một số từ trừu tượng của bài luận cho gần gũi với người dịch (và hy vọng cũng với người đọc) hơn. Người dịch ghi chú cá nhân ở khúc mình thấy khó hiểu thành một số đoạn văn bắt đầu bằng cụm "Người dịch ghi chú:", người đọc có thể bỏ qua mà không ảnh hưởng tới nội dung hay trải nghiệm đọc bài luận.

Tóm lược

Lập trình khác với gõ code ở chỗ có sự sáng tạo, thường được dạy bằng ví dụ nhằm trưng bày kỹ thuật cụ thể. Trong bài luận này, hành động lập trình được xem là một dãy lựa chọn về thiết kế để xem xét chia nhỏ từ nhiệm vụ thành nhiều nhiệm vụ phụ và từ dữ liệu thành cấu trúc dữ liệu. Tiến trình liên tiếp tinh chế nội dung chi tiết được minh họa bằng một ví dụ ngắn nhưng không tầm thường, từ đây rút ra một số kết luận về nghệ thuật và cách dạy lập trình.

Giới thiệu

Lập trình thường được dạy bằng ví dụ. Kinh nghiệm cho thấy sự thành công của khóa học lập trình phụ thuộc sống còn ở chỗ lựa chọn ví dụ nào. Không may là, ví dụ quá thường xuyên được chọn với ý định chính yếu là trình diễn xem máy tính (hay ngôn ngữ lập trình đang được dạy) có thể làm được gì. Thay vì vậy thì tiêu chuẩn tuyển chọn chính cần phải là vì ví dụ này phù hợp để trình diễn kỹ thuật áp dụng được ở nhiều nơi. Hơn nữa, chương trình ví dụ thường là "sản phẩm" đã hoàn thành kèm theo giải thích về mục đích và chi tiết ngữ nghĩa. Nhưng lập trình có tính thiết thực sở dĩ là thiết kế ra chương trình mới hơn là ngắm nghía chương trình cũ. Hệ quả của phương pháp dạy này là học trò có ấn tượng rằng lập trình chính yếu là thành thạo một ngôn ngữ (thạo luôn nhiều cái kỳ dị và rắc rối của nó nhất là với ngôn ngữ lập trình hiện đại) rồi nhờ cậy trực giác để biến đổi ý tưởng thành chương trình hoàn thiện bằng cách nào đó. Rõ ràng là khóa học lập trình cần phải dạy phương pháp thiết kế và xây dựng, và chọn được ví dụ trình diễn được sự triển khai dần dần một cách thú vị.

Bài viết này nêu một ví dụ được chọn với hai mục đích này trong đầu. Vài kỹ thuật thông dụng được trình diễn một cách vắn tắt và khuyến khích (chiến lược chọn trước, xây dựng lời giải để thử theo từng bước, giới thiệu dữ liệu phụ trợ, đệ quy), và chương trình được triển khai dần dần theo dãy các bước tinh chế.

Mỗi bước như vậy chia nhỏ câu lệnh của chương trình đã cho thành vài câu lệnh chi tiết hơn. Sự chia nhỏ hay tinh chế nội dung chi tiết liên tiếp này kết thúc khi mọi câu lệnh được diễn tả bằng ngôn ngữ máy tính hay ngôn ngữ lập trình bên dưới, do đó việc này phải theo hướng của phương tiện sẵn có trên máy hay ngôn ngữ muốn đến. Kết quả thực thi chương trình được diễn tả bằng dữ liệu, và có thể cần phải giới thiệu thêm dữ liệu để liên lạc giữa các nhiệm vụ phụ hay câu lệnh thu được. Càng tinh chế nhiệm vụ, thì có thể càng cần tinh chế, chia nhỏ, cấu trúc hóa dữ liệu; cho nên tinh chế nội dung chi tiết của chương trình và của dữ liệu một cách đồng thời là điều tự nhiên.

Mỗi bước tinh chế dẫn tới vài lựa chọn về thiết kế. Quan trọng là các lựa chọn này cần được làm cho tường minh và là người lập trình cần nhận biết các tiêu chuẩn bên dưới và sự tồn tại của các lời giải khác. Các lời giải khả dĩ của bài toán đã cho nhô ra tạo thành lá của cây, mỗi nút của cây này biểu diễn một chỗ tính toán cân nhắc và đưa ra lựa chọn. Các cây con có thể xem là các họ lời giải có tính chất và cấu trúc chung nào đó. Ý niệm như vậy về cây có thể giúp ích một cách đặc biệt trong tình huống thay đổi mục đích và môi trường mà chương trình đôi lúc phải thích ứng.

Thông tin hướng dẫn tiến trình tinh chế từng bước cần và càng cần phải là nguyên lý để chia nhỏ các lựa chọn, để gỡ rối các lãnh vực chỉ tưởng chừng phụ thuộc lẫn nhau, và để trì hoãn lựa chọn về biểu diễn chi tiết lâu nhất có thể. Nguyên lý này tạo ra chương trình dễ thích ứng hơn với nhiều môi trường (ngôn ngữ hay máy tính) khác nhau có thể cần nhiều cách biểu diễn khác nhau.

Bài toán mẫu được chọn được phát biểu ở đầu chương 3. Người đọc nên cố gắng tự tìm lời giải trước khi đưa mình vào phần luận giải, vốn chỉ trình bày một trong nhiều lời giải khả dĩ.

Ký pháp

Wirth trong bản gốc dùng ngôn ngữ mở rộng của Algol 60 để mô tả chương trình, bản dịch này thay vì vậy dùng ngôn ngữ mở rộng của Oberon-2 - công trình của chính tác giả - để mô tả. Oberon-2 là ngôn ngữ dễ đọc, mọi từ khoá tiếng Anh đều dễ hiểu và được ghi hoàn toàn bằng chữ in hoa. Người dịch mở rộng cho phép ký tự unicode trong định danh để tiện trình bày bằng tiếng Việt; và cho phép chỉ số của mảng thuộc khoảng định nghĩa tùy ý thay vì bắt đầu từ 0, để trình bày cho rõ hơn. Hiểu biết các từ khóa tiếng Anh có thể làm mô tả chương trình được tự nhiên hơn. Lưu ý là Algol 60 lẫn Oberon-2 đều cho phép khai báo thủ tục lồng nhau, trong đó thủ tục khai báo bên trong truy cập được biến của thủ tục bên ngoài.

Bài toán 8-hậu và một cách tiếp cận lời giải

Cho bàn cờ vua 8 x 8 và 8 quân hậu thù ghét nhau. Tìm cấu hình, tức vị trí đặt từng quân hậu sao cho không có quận hậu nào nằm trên đường đi của quân hậu khác (tức là sao cho mỗi dòng, mỗi cột và mỗi đường chéo chỉ chứa tối đa một quân hậu).

Bài toán này là tiêu biểu cho tình huống khá thường thấy là không biết lời giải phân tích (dạng đóng tổng quát), mà phải viện tới phương pháp thử sai. Điển hình là, tồn tại tập hợp ứng viên cho lời giải $A$, từ $A$ cần chọn ra một cái thoả điều kiện $p$ nhất định. Do đó một lời giải được mô tả đặc điểm là cái $x$ sao cho $(x \in A ) \land p(x)$.

Chương trình hiển nhiên để tìm một lời giải là:

REPEAT sinh ra phần tử tiếp theo của A và gọi nó là x
UNTIL p(x) OR (không còn phần tử nào khác trong A);
IF p(x) THEN lời giải là x

Chỗ khó của bài toán dạng này thường là kích thước kinh khủng của $A$ không cho phép sinh ra hết mọi ứng viên vì lo ngại về hiệu quả. Trong ví dụ hiện tại, $A$ có $64!/(56! \times 8!) \approx 2^{32}$ phần tử (cấu hình bảng). Giả định rằng sinh ra và kiểm tra mỗi cấu hình tốn 100 micro-giây, thì cần khoảng 7 tiếng đồng hồ tìm một lời giải. Rõ ràng là cần sáng chế "đường tắt", là phương pháp giúp loại trừ một lượng lớn đối thủ mà "dễ thấy" là bị loại. Chiến lược chọn trước này có đặc điểm như sau: tìm cách biểu diễn của $p$ mà có dạng $p = q \land r$, rồi đặt $Br={x | (x \in A) \land r(x)}$. Hiển nhiên là $Br \subseteq A$. Thay vì sinh ra phần tử của $A$ thì chỉ cần tạo ra phần tử của $B$ rồi kiểm tra bằng điều kiện $q$ thay vì $p$. Ứng viên phù hợp cho điều kiện $r$ là những cái thoả mãn các đòi hỏi này:

$B_r$ nhỏ hơn nhiều so với $A$.
Dễ dàng sinh ra phần tử của $B_r$.
Điều kiện $q$ dễ kiểm tra hơn điều kiện $p$.

Chương trình tương ứng lúc này là:

REPEAT sinh ra phần tử tiếp theo của B và gọi nó là x
UNTIL q(x) OR (không còn phần tử nào khác trong B);
IF q(x) THEN lời giải là x

Một điều kiện $r$ phù hợp cho bài toán 8-hậu là luật mỗi cột của bảng phải có đúng một quân hậu. Điều kiện $q$ lúc này chỉ còn là có tối đa một quân hậu trong mỗi dòng và trong mỗi đường chéo mà rõ ràng là ít nhiều dễ kiểm tra hơn $p$. Tập hợp $B_r$ (mọi cấu hình mà mỗi cột có một quân hậu) chứa "chỉ có" $8^8=2^{24}$ phần tử. Các cấu hình này được sinh ra bằng cách giới hạn chuyển động của từng quân hậu theo từng cột. Do đó mọi điều kiện ở trên đều thoả mãn.

Lại giả định thời gian 100 micro-giây để sinh ra và kiểm tra một lời giải tiềm năng, tìm một lời giải bây giờ chỉ mất 100 giây. Ai có máy tính mạnh trong tay thì có lẽ dễ dàng thoả mãn với hiệu năng dường này. Ai kém may mắn hơn và buộc phải, chẳng hạn giải bằng tay, thì mất 280 tiếng đồng hồ sinh ra và kiểm tra cấu hình với tốc độ một giây mỗi cái. Khi đó có lẽ đáng để dành thêm thời gian tìm đường tắt đi xa hơn. Thay vì áp dụng cùng phương pháp như trước, một phương pháp khác được phát biểu có đặc điểm như sau: Tìm cách biểu diễn lời giải để thử $x$ thành dạng $[x1, x2, ..., xn]$ sao cho có thể sinh ra mọi lời giải để thử từ các bước mà lần lượt tạo ra $[x1]$, $[x1, x2]$, ..., $[x1, x2, ..., x_n]$. Sự chia nhỏ này phải sao cho:

Mỗi bước (sinh ra $x_j$) phải tính toán đơn giản hơn đáng kể so với toàn bộ ứng viên $x$.
$q(x) \supset q(x1...xj)$ với mọi $j \leq n$.

Vậy không bao giờ thu được lời giải hoàn chỉnh bằng cách mở rộng lời giải để thử một phần mà không thoả vị từ $q$. Tuy nhiên ở chiều ngược lại, lời giải để thử một phần thoả $q$ có thể không mở rộng được thành lời giải hoàn chỉnh. Phương pháp gọi là xây dựng lời giải để thử theo từng bước này do đó cần phải "rút ngắn" lời giải để thử nếu thất bại ở bước j để mà thử hướng mở rộng khác. Kỹ thuật này gọi là quay lui với đặc điểm được khái quát bằng chương trình này:

j:=1;
REPEAT ThửBước j;
    IF ThànhCông THEN TiếnTới ELSE QuayLui
UNTIL (j<1) OR (j>n);

Trong ví dụ 8-hậu, có thể xây dựng lời giải bằng cách đặt quân hậu vào các cột liên tiếp bắt đầu từ cột 1 rồi ở từng bước thì đặt quân hậu vào cột tiếp theo. Hiển nhiên là cấu hình một phần mà không thoả điều kiện không đến được nhau thì không thể nào mở rộng bằng phương pháp này để trở thành lời giải hoàn chỉnh. Ngoài ra, vì ở bước thứ $j$ chỉ cần xem xét điều kiện không đến được nhau với $j$ quân hậu nên tìm lời giải một phần ở bước $j$ tốn ít công sức xem xét hơn tìm lời giải hoàn chỉnh mà toàn bộ 8 quân hậu nằm trên bàn cờ ở mọi lúc. Hai tiêu chí đã nêu do đó được thoả mãn bằng cách chia nhỏ sao cho bước $j$ đi tìm vị trí an toàn cho quân hậu ở cột thứ $j$.

Chương trình sắp tới được phát triển trên cơ sở là phương pháp này; nó sinh ra và kiểm tra 876 cấu hình một phần rồi tìm được lời giải hoàn chỉnh. Lại giả định mỗi bước sinh ra và kiểm tra (vốn đã dễ làm hơn lúc nãy) tốn một giây thì tìm thấy lời giải trong 15 phút, còn với máy tính tốn 100 micro-giây cho mỗi bước thì trong 0,09 giây.

Phát triển chương trình

Bây giờ chúng ta phát biểu phép sinh theo từng bước cho ra lời giải một phần cho bài toán 8-hậu bằng phiên bản đầu tiên của chương trình sau:

VAR bảng, conTrỏ, anToàn;
XétCộtĐầu;
REPEAT ThửCột;
    IF anToàn THEN
        ĐặtHậu; XétCộtKế
    ELSE QuayLui END
UNTIL XongCộtCuối OR QuayLuiKhỏiCộtĐầu

Chương trình này gồm một nhóm câu lệnh (hay thủ tục) ban sơ được liệt kê và mô tả hành vi như sau:

XétCộtĐầu. Một phần quan trọng của bài toán là xem xét tính an toàn của ô vuông. Biến conTrỏ chỉ định ô vuông đang xét. Cột chứa ô vuông đang xét gọi là cột đang xét. Thủ tục này khởi tạo conTrỏ để chỉ tới cột đầu tiên.

ThửCột. Bắt đầu từ ô vuông đang xét trong cột đang xét, đi xuống theo cột cho tới khi hoặc tìm thấy ô vuông an toàn thì gán biến Boolean anToàn thành TRUE, hoặc đã tới ô vuông cuối cùng mà vẫn không an toàn thì gán biến anToàn thành FALSE.

ĐặtHậu. Đặt một quân hậu vào ô vuông đang xét gần nhất.

XétCộtKế. Tiến tới cột kế tiếp và khởi tạo conTrỏ xét ô vuông.

QuayLui. Quay lui về cột còn dịch chuyển được quân hậu xuống tiếp, và xoá quân hậu nằm ở cột đã xảy ra quay lui. (Lưu ý là có thể cần quay lui tối đa hai cột. Tại sao?)

Trong các câu lệnh này, sự tinh chế nội dung chi tiết của ThửCột và QuayLui được chọn làm bước phát triển tiếp theo của chương trình như sau.

PROCEDURE ThửCột; 
BEGIN
REPEAT TiếnConTrỏ; ThửÔ
UNTIL anToàn OR ÔCuối
END ThửCột;

PROCEDURE QuayLui; 
BEGIN XétLạiCộtTrước;
IF ~QuayLuiKhỏiCộtĐầu THEN
    XóaHậu;
    IF ÔCuối THEN
        XétLạiCộtTrước;
        IF ~QuayLuiKhỏiCộtĐầu THEN
            XóaHậu
        END
    END
END
END QuayLui;

Chương trình được diễn tả dựa trên các câu lệnh:

XétCộtĐầu

XétCộtKế

XétLạiCộtTrước

TiếnConTrỏ

ThửÔ (gán biến anToàn)

ĐặtHậu

XóaHậu

và các vị từ:

ÔCuối

XongCộtCuối

QuayLuiKhỏiCộtĐầu

Để tinh chế các câu lệnh và vị từ này hơn nữa theo hướng câu lệnh và vị từ có mặt trong ngôn ngữ lập trình thông dụng, cần phải diễn tả chúng dựa trên dữ liệu biểu diễn được ở các ngôn ngữ đó. Do đó không còn trì hoãn lựa chọn làm sao biểu diễn các sự kiện liên quan dựa trên dữ liệu được nữa. Ưu tiên cao nhất của lựa chọn này được gán cho vấn đề là làm sao biểu diễn vị trí của các quân hậu và của ô đang xét.

Cách làm trực quan nhất (theo nghĩa phản ánh gần gũi nhất cái bàn cờ bằng gỗ và quân cờ bằng đá) là giới thiệu ma trận vuông Boolean với B[i,j]=TRUE biểu thị ô $(i,j)$ bị chiếm. Tuy nhiên sự thành công của thuật toán hầu như luôn luôn phụ thuộc vào lựa chọn cách biểu diễn dữ liệu cho phù hợp nhờ vào độ dễ mà cách này cho phép diễn tả các thao tác cần thiết. Bên cạnh đó, có thể cần ưu tiên đòi hỏi về lưu trữ (tuy trường hợp này thì không). Chỗ khó chung khi thiết kế chương trình nằm ở chuyện không may là tại thời điểm cần đưa ra lựa chọn về biểu diễn dữ liệu thì khó mà nhìn trước được các câu lệnh cần thiết sẽ thao tác chi tiết ra sao trên dữ liệu, và thường là gần như không thể ước tính được lợi thế của cách biểu diễn khả dĩ này so với cách kia. Nói chung, nên trì hoãn lựa chọn về cách biểu diễn dữ liệu lâu nhất có thể (mãi tới khi thấy rõ không có lời giải khả thi nào đáp ứng thuật toán đã chọn).

Trong bài toán trình bày ở đây, ở bước này cũng thấy được khá rõ ràng là lựa chọn sau thích hợp hơn ma trận vuông Boolean về độ đơn giản của câu lệnh sau đó cũng như độ tiết kiệm bộ nhớ.

$j$ là chỉ số của cột đang xét; $(x[j],j)$ là toạ độ của ô đang xét gần nhất; và vị trí của quân hậu ở cột $k<j x b c to trong l n khai bi>conTrỏ và bảng được tinh chế thành:</j>

j: INTEGER (* 0<=j<=9 *)
x[1..8]: ARRAY OF INTEGER (* 0<=x[i]<=8 *)

và vài câu lệnh và vị từ ở trên được tiếp tực tinh chế thành ra như sau:

PROCEDURE XétCộtĐầu; 
BEGIN j:=1; x[1]:=0
END XétCộtĐầu;

PROCEDURE XétCộtKế; 
BEGIN j:=j+1; x[j]:=0
END XétCộtKế;

PROCEDURE XétLạiCộtTrước; 
BEGIN j:=j-1 
END XétLạiCộtTrước;

PROCEDURE TiếnConTrỏ; 
BEGIN x[j]:=x[j]+1; 
END TiếnConTrỏ;

PROCEDURE ÔCuối: BOOLEAN; 
RETURN x[j]=8; 
END ÔCuối;

PROCEDURE XongCộtCuối: BOOLEAN; 
RETURN j>8; 
END XongCộtCuối;

PROCEDURE QuayLuiKhỏiCộtĐầu: BOOLEAN;
RETURN j<1;
END QuayLuiKhỏiCộtĐầu;

Ở bước này, chương trình được diễn tả dựa trên các câu lệnh:

ThửÔ

ĐặtHậu

XóaHậu

Thực tế là câu lệnh ĐặtHậu và XóaHậu có thể xem là rỗng, nếu chúng ta lựa chọn thủ tục ThửÔ để xác định giá trị của biến anToàn chỉ dựa vào các giá trị $x1$ ... $x{j-1}$ tức là vị trí bấy giờ của $j-1$ quân hậu trên bảng. Nhưng không may ThửÔ là câu lệnh được thực thi thường xuyên nhất, nên để cho ra lời giải tốt thì việc xem xét tính hiệu quả của câu lệnh này không những hợp lý mà còn thiết yếu. Rõ ràng là phiên bản ThửÔ diễn tả chỉ dựa trên $x1$ ... $x{j-1}$ thì kiểu gì cũng kém hiệu quả. Thật hiển nhiên là ThửÔ được thực thi thường xuyên hơn hẳn ĐặtHậu và XóaHậu. Hai thủ tục sau được thực thi mỗi lần cột ($j$) thay đổi (cho là $m$ lần), còn thủ tục đầu tiên được thực thi mỗi lần có sự di chuyển tới ô vuông tiếp theo (tức $xj$ bị đổi; cho là $n$ lần). Tuy nhiên, chỉ có thủ tục ĐặtHậu và XóaHậu ảnh hưởng tới bàn cờ. Tính hiệu quả do đó đạt được bằng phương pháp *giới thiệu biến phụ trợ* $V(x1 ... x_j)$ sao cho:

Tính được ô vuông có an toàn không từ $V(x)$ dễ hơn là tính trực tiếp từ $x$ (cho là trong $u$ đơn vị tính toán thay vì $ku$ đơn vị tính toán).
Sự tính toán $V(x)$ từ $x$ (mỗi khi $x$ thay đổi) là không quá phức tạp (cho là trong $v$ đơn vị tính toán).

Giới thiệu $V$ là có lợi (chưa tính tới mối quan tâm về tính tiết kiệm bộ nhớ), nếu

$n(k-1)u > mv$ hay $\frac{n}{m}(k-1) > \frac{v}{u}$

tức là nếu lượng lợi về đơn vị tính toán lớn hơn lượng mất.

Người dịch ghi chú: Mình từng cảm thấy vướng chỗ này, nhưng quả Wirth là nhà sư phạm giỏi khi ông tạo ra những thử thách nhỏ cho người đọc (ít nhất là cho mình). Trước khi tạo biến phụ thì lượng tính toán là $nku$, vì cột $j$ đổi hay không đổi thì vẫn phải tính lại anToàn, nên lượng tính toán không phụ thuộc $m$. Sau khi tạo biến phụ $V$ thì mỗi lần cột $j$ đổi - vốn có $m$ lần như vậy - phải tính lại $V$ tốn $v$; mỗi lần cần tính anToàn - vốn có $n$ lần như vậy - tốn $u$ thay vì $ku$ như cũ, vậy tổng lượng tính toán là $mv+nu$. Lượng đầu lớn hơn lượng sau thì sự giới thiệu $V$ là có lợi hơn. Hết ghi chú.

Cách làm trực quan nhất thu được phiên bản ThửÔ đơn giản là giới thiệu ma trận Boolean $B$ sao cho B[i,j] = TRUE báo hiệu ô $(i,j)$ không bị quân hậu khác chiếm. Nhưng không may, sự tính toán lại khi quân hậu mới bị xoá đi ($v$) bị cản trở (tại sao?) và do đó lớn hơn lượng lợi nhiều.

Khoảnh khắc bắt đầu nhận ra sự liên quan của điều kiện về tính an toàn của ô vuông là ô vuông không được nằm trên dòng hay đường chéo đã bị quân hậu khác chiếm, là lúc dẫn tới lựa chọn tiết kiệm hơn nhiều cho $V$. Chúng ta giới thiệu ba mảng Boolean $a$, $b$, $c$ với ý nghĩa:

$a_k$ = TRUE : không có quân hậu nào trong dòng $k$

$b_k$ = TRUE : không có quân hậu nào trong đường chéo / $k$

$c_k$ = TRUE : không có quân hậu nào trong đường chèo \ $k$

Phạm vi chỉ số của các mảng này được lựa chọn là vì thực tế là các ô có cùng tổng toạ độ nằm trên cùng đường chéo / và các ô có cùng hiệu toạ độ nằm trên cùng đường chéo . Với các dòng và cột có chỉ số từ 1 tới 8, chúng ta thu được:

a[1..8], b[2..16], c[-7..7]: ARRAY OF BOOLEAN

Với mỗi lần giới thiệu dữ liệu phụ trợ, cần chú ý khởi tạo cho đúng. Vì thuật toán của chúng ta bắt đầu từ bàn cờ trống, phải biểu diễn sự thật này bằng cách khởi tạo giá trị TRUE cho mọi thành phần của các mảng $a$, $b$, $c$. Bây giờ có thể viết:

PROCEDURE ThửÔ;
BEGIN anToàn:=a[x[j]] AND b[j+x[j]] AND c[j-x[j]]
END ThửÔ;

PROCEDURE ĐặtHậu;
BEGIN a[x[j]]:=FALSE; b[j+x[j]]:=FALSE; c[j-x[j]]:=FALSE
END ĐặtHậu;

PROCEDURE XóaHậu;
BEGIN a[x[j]]:=TRUE; b[j+x[j]]:=TRUE; c[j-x[j]]:=TRUE
END XóaHậu;

Tính đúng đắn của thủ tục cuối cùng là do mỗi quân hậu hiện tại trên bàn cờ vốn dĩ đã nằm trên ô vuông an toàn, và do mọi quân hậu mà đặt sau quân hậu cần xoá bỏ thì đã được xoá bỏ từ trước đó. Do đó ô vuông được xoá trống lại trở nên an toàn.

Xem xét phản biện chương trình thu được tiết lộ rằng biến x[j] xuất hiện rất thường xuyên, cụ thể là ở những chỗ được thực thi thường xuyên nhất của chương trình. Hơn nữa, sự xem xét x[j] xảy ra với tần số dày đặc hơn sự gán lại cho j. Hệ quả là, có thể áp dụng nguyên lý giới thiệu dữ liệu phụ trợ lần nữa để tăng tính hiệu quả: biến mới

i: INTEGER

được dùng để biểu diễn giá trị mà nãy giờ biểu thị bằng x[j]. Vì vậy và x[j]:=i phải luôn được thực thi trước khi j tăng lên, và i:=x[j] sau khi j giảm xuống. Bước cuối cùng phát triển chương trình này dẫn tới sự phát biểu lại một số thủ tục bên trên như sau:

PROCEDURE ThửÔ;
BEGIN anToàn:=a[i] AND b[i+j] AND c[i-j]
END ThửÔ;

PROCEDURE ĐặtHậu;
BEGIN a[i]:=FALSE; b[i+j]:=FALSE; c[i-j]:=FALSE;
END ĐặtHậu;

PROCEDURE XóaHậu;
BEGIN a[i]:=TRUE; b[i+j]:=TRUE; c[i-j]:=TRUE;
END XóaHậu;

PROCEDURE XétCộtĐầu;
BEGIN j:=1; i:=0
END XétCộtĐầu;

PROCEDURE TiếnConTrỏ;
BEGIN i:=i+1; 
END TiếnConTrỏ;

PROCEDURE XétCộtKế;
BEGIN x[j]:=i; j:=j+1; i:=0
END XétCộtKế;

PROCEDURE ÔCuối: BOOLEAN; 
RETURN i=8; 
END ÔCuối;

Chương trình cuối cùng sử dụng các thủ tục

ThửÔ
ĐặtHậu
QuayLui
XóaHậu

và đem thay thế trực tiếp các thủ tục còn lại, chương trình giờ đây có dạng

j:=1; i:=0;
REPEAT
    REPEAT i:=i+1; ThửÔ
    UNTIL anToàn OR (i=8);
    IF anToàn THEN
        ĐặtHậu; x[j]:=i; j:=j+1; i:=0
    ELSE QuayLui END;
UNTIL (j>8) OR (j<1);
IF j>8 THEN InRa(x) ELSE ThấtBại END;

Đáng chú ý là chương trình này vẫn thể hiện cấu trúc của phiên bản đã thiết kế ở bước đầu tiên. Dĩ nhiên là bằng cùng phương pháp tinh chế chương trình từng bước, có thể gợi ra và phát triển nhiều lời giải khác hợp lý như nhau. Một lời giải khác dưới đây được E. W. Dijkstra gợi ý cho tác giả, dựa trên góc nhìn là bài toán này gồm có sự từng bước mở rộng bảng theo từng cột có chứa một quân hậu ở vị trí an toàn, bắt đầu từ bảng trống và kết thúc sau 8 cột. Tiến trình mở rộng bảng được phát biểu thành thủ tục, và cách làm tự nhiên để thu được bảng hoàn chỉnh là gọi đệ quy thủ tục này. Dễ dàng soạn ra thủ tục này từ các câu lệnh nguyên thuỷ dùng trong lời giải đầu tiên.

PROCEDURE ThửCột(j: INTEGER);
VAR i: INTEGER;
BEGIN
    i:=0;
    REPEAT i:=i+1; ThửÔ;
        IF anToàn THEN
            ĐặtHậu; x[j]:=i;
            IF j<8 THEN ThửCột(j+1) END;
            IF ~anToàn THEN XóaHậu END;
        END;
    UNTIL anToàn OR (i=8);
END ThửCột;

Lúc này chương trình dùng thủ tục này là:

ThửCột(1);
IF anToàn THEN InRa(x) ELSE ThấtBại END;

(Lưu ý rằng vì sự giới thiệu biến i là cục bộ trong thủ tục đệ quy, nên mỗi cột có con trỏ biểu thị i riêng. Hệ quả là các thủ tục

ThửÔ
ĐặtHậu
XóaHậu

cũng phải được khai báo cục bộ bên trong ThửCột, bởi vì chúng tham chiếu tới biến i chỉ định ô đang duyệt qua trong cột hiện tại.)

Bài toán 8-hậu tổng quát

Trong thế giới tính toán thực tiễn, ít khi gặp chương trình mà một khi thực hiện đúng và hài lòng thì giữ mãi không thay đổi nữa. Thường là sớm muộn người dùng nhận ra chương trình của họ không đưa ra mọi kết quả mong muốn, hoặc tệ hơn là, các kết quả được yêu cầu không thực sự cần thiết. Khi đó cần mở rộng hoặc thay đổi chương trình, và chính tình huống này là chỗ mà phương pháp thiết kế chương trình từng bước và cấu trúc hóa có phương pháp là có giá trị và lợi thế nhất. Nếu cấu trúc và các thành phần chương trình được chọn cho tốt, thì thường là nhiều câu lệnh cấu thành có thể làm theo không cần đổi. Nhờ vậy giảm được rất nhiều công sức thiết kế lại và kiểm nghiệm lại. Thực tế thì tính thích ứng của chương trình đối với sự thay đổi mục tiêu (còn gọi là tính dễ bảo trì) và đối với sự thay đổi môi trường (còn gọi là tính dễ di động - portability) được đo đạc chủ yếu bằng mức độ gọn gàng của cấu trúc của chương trình đó.

Mục tiêu của chương tiếp theo là trình diễn lợi thế này khi xét tổng quát hóa bài toán 8-hậu gốc cùng lời giải bằng cách mở rộng các thành phần chương trình đã giới thiệu từ trước.

Bài toán tổng quát được phát biểu như sau:

Tìm mọi cấu hình khả dĩ của 8 quân hậu thù ghét nhau trên bàn cờ vua 8 x 8, sao cho không có quân hậu nào đến được quân hậu khác.

Bài toán mới về bản chất gồm hai phần:

Tìm phương pháp sinh ra thêm lời giải.
Xác định xem mọi lời giải đã được sinh ra hay chưa.

Rõ ràng là cần phải sinh ra và kiểm tra ứng viên cho lời giải theo lối có phương pháp nào đó. Một kỹ thuật thường dùng là tìm cách sắp thứ tự ứng viên và tìm điều kiện nhận diện ứng viên cuối cùng. Nếu tìm thấy một cách sắp thứ tự thì có thể ánh xạ các lời giải vào các số nguyên. Điều kiện giới hạn giá trị số nguyên tương ứng với các lời giải thì trở thành tiêu chí dừng thuật toán, nếu phương pháp được chọn sinh ra lời giải theo thứ tự tăng nghiêm ngặt.

Dễ tìm nhiều cách sắp thứ tự các lời giải cho bài toán hiện tại. Để cho tiện chúng ta chọn ánh xạ

$M(x) = \sum{j=1}^8{xj 10^{j-1}}$

Cận trên của các lời giải khả dĩ là

$M(x_{max}) = 88888888$

và sự "tiện lợi" nằm ở chỗ chương trình ở phần trước sinh ra lời giải nhỏ nhất nên có thể xem đây là điểm bắt đầu để tiếp tục lời giải kế tiếp. Đây là nhờ cách thử ô vuông đã chọn là tiếp tục một cách nghiêm ngặt theo thứ tự tăng dần của $M(x)$ bắt đầu từ 00000000. Bây giờ cần phải chọn cách thức sinh ra lời giải tiếp theo bắt đầu từ cấu hình lời giải đang có, tiếp tục theo cùng thứ tự tăng dần của $M$, cho tới khi tìm thấy lời giải cao hơn hoặc đạt tới giới hạn.

Chương trình mở rộng

Kỹ thuật mở rộng hai chương trình đã cho - vốn tìm một nghiệm của bài toán 8-hậu đơn giản - căn cứ ý tưởng là chỉ điều chỉnh cấu trúc toàn cục và là dùng lại các khối xây dựng đã có. Cấu trúc toàn cục cần điều chỉnh sao cho một khi tìm thấy lời giải thì thuật toán sinh ra biểu thị tương ứng - chẳng hạn như in ra lời giải - rồi tiếp tục tìm lời giải kế tiếp cho tới khi tìm thấy hoặc đạt tới giới hạn. Điều kiện đơn giản cho sự đạt tới giới hạn là sự kiện quân hậu đầu tiên di chuyển vượt qua dòng 8, lúc này xảy ra sự quay lui khỏi cột đầu tiên. Các ý cân nhắc này dẫn tới phiên bản chỉnh sửa này của chương trình không đệ quy:

XétCộtĐầu;
REPEAT ThửCột;
    IF anToàn THEN
        ĐặtHậu; XétCộtKế;
        IF XongCộtCuối THEN
            InRa(x); QuayLui
        END
    ELSE QuayLui END
UNTIL QuayLuiKhỏiCộtĐầu;

Biểu hiện tìm thấy lời giải bằng cách lập tức in ra xảy ra trực tiếp ở thời điểm nhận diện, tức là trước khi rời khỏi lệnh lặp REPEAT. Rồi thuật toán tiếp tục tìm lời giải kế tiếp, nhờ đó dùng đường tắt bằng cách là trực tiếp quay lui về cột trước đó; vì mỗi dòng của lời giải có một quân hậu, nên một khi đã tìm thấy lời giải thì tiếp tục tiến quân hậu cuối cùng trong cột thứ tám không có ích gì.

Chương trình đệ quy còn mở rộng dễ dàng hơn theo cùng ý tưởng cân nhắc:

PROCEDURE ThửCột (j: INTEGER);
VAR i: INTEGER;
(* Khai báo ThửÔ, TiếnHậu, ĐặtHậu, XóaHậu, ÔCuối *)
BEGIN
i:=0;
REPEAT TiếnHậu; ThửÔ;
    IF anToàn THEN
        ĐặtHậu; x[j]:=i;
        IF ~XongCộtCuối THEN ThửCột(j+1) ELSE InRa(x) END;
        XóaHậu
    END;
UNTIL ÔCuối
END ThửCột;

Chương trình chính bắt đầu thuật toán gồm một câu lệnh ThửCột(1) (bên cạnh bước khởi tạo $a$, $b$, $c$).

Cuối cùng thì, cần chú ý là hai chương trình biểu diễn cùng một thuật toán. Cả hai đều xác định 92 lời giải theo cùng thứ tự bằng cách thử ô vuông 15720 lần. Tính ra trung bình là 171 lần thử cho mỗi lời giải; tối đa là 876 lần thử để tìm thấy lời giải kế tiếp (là lời giải đầu tiên), tối thiểu là 8 lần. (Cả hai chương trình được viết mã nguồn bằng ngôn ngữ Pascal và được thực thi bằng máy tính CDC 6400 trong vòng dưới một giây.)

Kết luận

Các bài học mà ví dụ đã mô tả có nhiệm vụ minh họa được tóm tắt thành các điểm sau đây.

Sự xây dựng chương trình gồm dãy nhiều bước tinh chế. Ở mỗi bước một nhiệm vụ được chia nhỏ thành một số nhiệm vụ phụ. Mỗi sự tinh chế nội dung mô tả nhiệm vụ có thể phải đi cùng với sự tinh chế nội dung mô tả của dữ liệu cấu thành phương tiện liên lạc các nhiệm vụ phụ với nhau. Cần phải tinh chế nội dung mô tả của chương trình và của cấu trúc dữ liệu một cách đồng thời.
Mức độ của tính mô-đun có được từ cách làm này sẽ xác định độ dễ hay khó để một chương trình thích ứng với sự thay đổi và mở rộng về mục đích hay sự thay đổi về môi trường (ngôn ngữ, máy tính) thực thi.
Suốt tiến trình tinh chế từng bước, cần dùng ký pháp có tính tự nhiên đối với vấn đề trong tay nhiều hết mức có thể. Hướng đi mà các ký pháp này phát triển trong tiến trình tinh chế được xác định bằng ngôn ngữ mà chương trình cuối cùng phải đặc tả, tức là ký pháp ở bước cuối cùng phải đạt tới. Ngôn ngữ này do đó cần phải cho phép chúng ta diễn tả một cách tự nhiên và rõ ràng nhất có thể cấu trúc chương trình và dữ liệu xuất hiện suốt tiến trình thiết kế. Đồng thời, ngôn ngữ này phải đưa ra hướng dẫn cho tiến trình tinh chế bằng cách trưng bày các tính năng cơ bản và nguyên lý cấu trúc có tính tự nhiên với máy tính thực thi chương trình được tạo ra. Đáng nói là khó mà tìm thấy ngôn ngữ thỏa các yêu cầu quan trọng này ở mức độ thấp hơn một ngôn ngữ mà thời điểm này (1971) vẫn được dùng rộng rãi để dạy lập trình: Fortran.

Người dịch ghi chú: Hơn năm mươi năm sau (2025), tính thời sự của câu nói vẫn còn đối với ngôn ngữ dạy lập trình ngày nay như C++ hay Javascript hay Python. So với Fortran có tiến bộ hơn, nhưng mình thấy chưa tiến xa lắm. Ngữ pháp cồng kềnh và cú pháp không tự nhiên của C++ là rất tồi đối với yêu cầu đầu tiên, và không mấy tốt ở yêu cầu thứ hai nếu dùng tính năng 'cao cấp'; Javascript và Python thì không mấy tốt ở cả hai, vừa không tự nhiên để mô tả dữ liệu do kiểu động, vừa không tự nhiên với máy tính mà cần biên hay phiên dịch lại. Ngày nay người dạy lập trình nhằm tăng tính hấp dẫn của khóa học có xu hướng vụ lấy ngôn ngữ có nhiều tiện ích phụ trợ giúp làm ra sản phẩm dễ dàng và nhanh chóng - vốn không phải là tinh hoa của kiến thức lập trình cần được dạy. Đây cũng là lý do người dịch chọn Oberon để mô tả chương trình vì chúng thỏa mãn cả hai yêu cầu có tính sư phạm ở trên. Hết ghi chú.

Mỗi bước tinh chế kéo theo một số lựa chọn về thiết kế dựa trên một nhóm tiêu chuẩn thiết kế. Trong các tiêu chuẩn này có thể kể tính hiệu quả, tính tiết kiệm lưu trữ, tính rõ ràng, và tính ít ngoại lệ (tính thường quy - regularity) của cấu trúc. Học sinh cần được dạy để có ý thức về các lựa chọn rối rắm, để xem xét phản biện, và để bác bỏ lời giải, thậm chí vào đôi lúc mà lời giải vẫn đúng nếu chỉ nhìn kết quả; họ phải học để cân nhắc nhiều khía cạnh của các thiết kế thay thế dựa trên các tiêu chuẩn này. Cụ thể là họ phải được dạy là cần phải rút lại lựa chọn trước đó và lùi về, thậm chí về lại từ đầu nếu cần thiết. Thường vài bài toán tương đối ngắn là đủ minh họa điều quan trọng này; không cần thiết phải xây dựng một hệ điều hành cho mục đích này.
Sự diễn giải chi tiết quá trình phát triển của một chương trình dù là ngắn cũng tạo thành câu chuyện dài, chứng tỏ rằng lập trình cẩn thận không phải chủ đề tầm thường. Nếu bài luận này đã giúp phá vỡ niềm tin đang thịnh hành là lập trình dễ lắm miễn sao có ngôn ngữ lập trình đủ mạnh và máy tính đủ nhanh, thì nó đã đạt được một trong các mục đích.

Ghi nhận

Tác giả ghi nhận một cách biết ơn ảnh hưởng hữu ích và thú vị từ nhiều cuộc thảo luận với C. A. R. Hoare và E. W. Dijkstra.

Tham khảo

Các bài luận sau đây được liệt kê nhằm tham khảo xa hơn về chủ đề lập trình. Người dịch do đó giữ nguyên tên và cấu trúc trình bày tên bài luận, nhằm giữ nguyên giá trị tra cứu.

Dijkstra, E. W. A constructive approach to the problem of program correctness. BIT 8 (1968), 174-186.
Dijkstra, E. W. Notes on structured programming. EWD 249, Technical U. Eindhoven, The Netherlands, 1969.
Naur, P. Programming by action clusters. BIT 9 (1969) 250-258.
Wirth, N. Programming and programming languages. Proc. Internat. Comput. Symp., Bonn, Germany, May 1970.

gigajet

o15, Tháng 1, 2025, 16:00 1

Blog - Trang 1

Khái lược nghệ thuật nhồi cấu trúc

Khái lược nghệ thuật nhồi cấu trúc

Tiêu chuẩn về căn chỉnh

Padding, tức căn lề

Căn chỉnh và căn lề trong cấu trúc struct

Về trường bit (bitfield)

Sắp đặt lại cấu trúc

Một số ngoại lệ

Tính dễ đọc và tính cục bộ bộ nhớ đêm

Cẩn thận khi dùng trường bit và union để tiết kiệm bộ nhớ.

Một số công cụ có thể tham khảo thêm, nghe đồn

Phát triển chương trình bằng cách tinh chế từng bước

Phát triển chương trình bằng cách tinh chế từng bước

Tóm lược

Giới thiệu

Ký pháp

Bài toán 8-hậu và một cách tiếp cận lời giải

Phát triển chương trình

Bài toán 8-hậu tổng quát

Chương trình mở rộng

Kết luận

Ghi nhận

Tham khảo

Căn chỉnh và căn lề trong cấu trúc `struct`