Đề thi THPT Quốc gia môn Toán năm 2015, De thi thu THPT Quoc Gia nam 2015

You are here: Home »

Like VNMATH on FACEBOOK để ủng hộ VNMATH.

Luật Benford

VNMATH.COM 7 tháng 9, 2012 0

Với những ai chưa biết Luật Benford có thể tóm tắt qui luật này như sau: các con số (hệ thập phân) trong tự nhiên (ví dụ độ dài một con sông, chiều cao một tòa nhà, lợi nhuận một công ty...) có một tính chất kỳ lạ là chữ số đầu tiên có một phân phối không đồng đều mà tuân thủ theo qui luật giảm dần, số 1 có xác suất xuất hiện khoảng 30%, số 2 khoảng 17.6%,... số 9 khoảng 4.5%.

Hãy thử xét một tập hợp các số liệu bất kỳ bạn nghĩ tới, ví dụ như độ dài của các dòng sông trên thế giới, dân số ở các làng ở Peru, hay các con số trong bảng kê khai thuế của Bill Clinton. Lấy một mẫu về các tập hợp số nói trên và nhìn vào số đầu tiên (bỏ qua số 0). Và đếm có bao nhiêu số bắt đầu với 1, bao nhiêu số bắt đầu với 2, và 3.. cứ thế.

Bạn có thể đoán rằng, kết quả của việc đếm sẽ là: số các số có chữ số bắt đầu khác nhau đều có số lượng bằng nhau, và tỉ lệ xuất hiện của các số bắt đầu với một chữ số bất kỳ giữa 1 đến 9 là 1/9. Đúng không? Bạn chắc chưa?

Sai. Việc phân phối các số đầu tiên không bằng nhau, và thực tế, chữ số thường được bắt đầu nhất là số 1, và chữ số bắt đầu ít nhất là 9. Tin hay không thì tùy, có hẳn một công thức để mô tả việc đó, một định luật. Luật Benford, hay còn gọi là “Luật Chữ số Thứ nhất”. Về cơ bản, luật này phát biểu rằng một tập hợp danh sách các số liệu được lấy ra từ các nguồn thực tế sẽ tuân theo một dạng nhất định về xác suất của các chữ số đầu tiên.

Nhà toán học – thiên văn học người Mỹ-Canada Simon Newcomb (1835 – 1909) được ghi nhận như người đầu tiên để ý tới định luật đáng kinh ngạc này. Ông đã nhắc tới nó ở một nghiên cứu năm 1881 “Ghi chép về Tần suất sử dụng các Chữ số khác nhau trong Các số tự nhiên.” Trong khi như quan sát của Newcomb là rất quan trọng, thì chính nhà vật lý Frank Benford vào năm 1938, sau khi xem các mẫu dạng khác nhau trong nghiên cứu cá nhân, mới là người ghép 2 với 2 làm 4. Ông đã thu thập rất nhiều loại số liệu, kể cả các địa chỉ của 342 người đầu tiên được ghi trong Các nhà khoa học Mỹ. Trong phân tích của mình, ông tìm ra có khoảng 30% con số bắt đầu với 1, 18% với 2, và cứ thế. Định luật này cũng có thể lặp lại với các tập hợp dữ liệu khác, ví dụ như kết quả trận bóng chày, tỉ lệ tử vong, giá cổ phiếu, địa chỉ nhà, và hóa đơn điện, nhưng ngay cả Benford cũng không thể giải thích tại sao nó lại như thế.

Hãy tiến nhanh tới năm 1961, khi nhà toán học người Mỹ Roger Pinkham xem xét lại vấn đề này. Pinkhaym tin rằng có khả năng để giải thích cho định luật này. Ông phỏng đoán rằng trên thực tế có một luật về “tần suất chữ số”, và gợi ý rằng luật này được áp dụng cho toàn vũ trụ, bất kể chữ số kia được biểu thị dưới dạng nào, dù là giá đồng đô la ở Drachma, hay đo bằng inch, bit lượng tử hay mét. Pinkham gọi đây là “tỉ lệ bất biến” trên toàn vũ trụ, và là người đầu tiên chỉ ra rằng luật Benford, thực tế là, tỉ lệ bất biến. Điều này cũng đúng. Nếu có một quy luật nào về tần suất của các chữ số là một tỉ lệ bất biến, quy luật đó hẳn là luật Benford.


Luật Benford trong Bảng 10 chỉ ra tỉ lệ phần trăm của chữ số đầu tiên từ 1 đến 9.
1 - 30.1 %
2 – 17.6 %
3 – 12.5%
4 – 9.7 %
5 – 7.9 %
6 – 6.7 %
7 – 5.8 %
8 – 5.1 %
9 – 4.6 %

Các thí nghiệm xa hơn với luật Benford đã được thực hiện trên tất cả các số liệu kinh doanh và các tỉ lệ quay vòng hàng năm cho tới các hằng số vật lý cơ bản, nhưng luật này cũng có những hạn chế của nó. Các con số không được là ngẫu nhiên, như kết quả xổ số (xin lỗi nhé!) và không thể quá hạn chế khi tập hợp các xác suất là quá hạn hẹp. Vì thế, khi bạn không thể dùng nó để chọn ra kết quả xổ số 50 triệu đô Power Lotto tuần tới, bạn có thể dùng luật Benford theo nhiều cách quan trọng khác.

Các nhà nghiên cứu dùng luật Benford để tìm ra các số liệu giả mạo trong kê khai thuế và dữ liệu tài chính (bản kê khai thuế của Bill Clinton được nghiên cứu bởi giáo sư kế toán Tiến sĩ Mark Nigrini, ông đã dùng luật này và, thật đáng ngạc nhiên, không có bất kỳ sự gian lận nào bị tìm thấy!); cũng như nhiều ứng dụng hữu dụng khác, như kiểm tra sự bất quy tắc trong các cuộc thử nghiệm thuốc hay xác thực các mô hình biểu đồ dữ liệu.

Cũng như tất cả những điều tốt đẹp khác, luật này cũng có giới hạn nhất định. Cho dù nó không thể áp dụng vào một tập hợp các số nhất định nào đó, nhưng đây là một ví dụ thú vị về một công thức toán học có thể được sử dụng để giải thích cho những thứ có vẻ như là các “tình huống bí ẩn” liên quan đến sự xuất hiện của một chữ số trong một tập hợp dữ liệu lớn.

Về VNMATH.COM

VNMATH hoạt động từ năm 2008 với slogan Trao đổi để học hỏi, Sẻ chia để vươn lên. Hiện nay VNMATH.COM là trang web Toán học có lượt truy cập lớn nhất Việt Nam.

Chia sẻ bài viết này


Bài viết liên quan

Không có nhận xét nào :

Để lại Nhận xét