Trong bóng đá hiện đại, những con số thống kê phức tạp dần đóng một vai trò quan trọng với mọi khía cạnh từ tập luyện đến thi đấu. Dù vậy, việc phân tích dữ liệu để áp dụng vào các trận bóng đã từng được người Anh áp dụng từ hơn nửa thế kỷ trước.
ảnh minh họa
Trước khi Simon Wilson bắt tay vào công việc tại Southampton, ông mới chỉ là chuyên viên tư vấn cho một công ty khởi nghiệp có cái tên lạ lẫm Prozone. Khi đó, Prozone đã phát triển thành công phần mềm có khả năng thu thập dữ liệu cầu thủ dựa vào tám camera lắp quanh sân bóng. Những camera này có thể ghi lại chuyển động của cầu thủ mỗi 0.1 giây và lưu trữ hơn 3,000 lần chạm bóng mỗi trận. Nhận thấy sự hiệu quả của công cụ thống kê này, Southampton quyết định tuyển dụng Wilson, một người thông thạo về Prozone, trở thành chuyên gia phân tích dữ liệu cho đội bóng.
“Ở thời điểm đó, Prozone là một cái gì đó hoàn toàn mới mẻ và hầu hết các huấn luyện viên không hề biết đến nó. Hồi đó tôi cứ ngây thơ nghĩ rằng, tại sao họ không thèm đếm xỉa đến những thông số này chứ?”, Wilson nói và nhớ về một trận đấu diễn ra hồi năm 2005 khi Southampton tiếp đón Luton Town. Trước trận, ông tham dự cuộc họp đội cùng huấn luyện viên trưởng Harry Redknapp. “Harry là một người thích đưa ra các quyết định theo dự cảm hơn là tính toán. Ông ấy không thoải mái lắm trong việc nhồi nhét chiến thuật vào đầu cầu thủ.”
Southampton để thua với tỉ số 2-3. Trên xe bus trở về khách sạn, Redknapp quay sang và ném cho Wilson những lời xỉa xói: “Để tôi nói cho cậu nghe này, tại sao cậu không lấy cái máy tính của cậu ra và đấu lại với máy tính của họ để xem ai thắng?”
Đương nhiên không phải ai cũng giống Redknapp và Wilson chắc hẳn cũng không thể thành công nếu không có được sự chống lưng phía sau. Ông là Clive Woodward, người từng là huấn luyện viên trưởng đội tuyển rugby Anh vô địch World Cup năm 2003. Ông cũng là người đầu tiên áp dụng Prozone vào môi trường rugby để thu thập dữ liệu và giải mã các thông số của đối thủ lẫn chính đội tuyển nhà.
“Tôi cảm thấy thật tuyệt vời trong lần đầu tiên sử dụng nó. Mọi chuyển động phức tạp được tối giản lại chỉ còn những chấm tròn và thông số. Nó giúp loại bỏ mọi định kiến vốn có về phong cách thi đấu của đối thủ.” Woodward nói. Sau quãng thời gian thành công cùng rugby, ông chuyển ngạch sang bóng đá và nhậm chức Giám đốc Bóng đá tại Southampton. Kể từ đó, Woodward và Wilson trở thành cặp bài trùng song kiếm hợp bích.
“Ông ấy luôn hỏi tôi về mọi khía cạnh của trận đấu: Tại sao chúng tôi mất nhiều thời gian đến thế để ghi bàn? Tại sao chúng tôi không thể ngăn họ ghi bàn? Tôi cứ giải thích và ông ấy cứ hỏi.” Wilson hồi tưởng. Cả hai người sau đó cùng nhau thực hiện một loạt những thử nghiệm về đo đạc và giải mã dữ liệu cầu thủ. Dù những sáng kiến đó không kéo dài được lâu, nhưng nó là tiền đề mở ra một kỉ nguyên hoàn toàn mới cho bóng đá.
Wilson hiện là trưởng bộ phận phân tích dữ liệu của Manchester City. Ảnh: Wired.
Woodward rời Southampton chỉ sau một năm với hi vọng tìm kiếm được một môi trường phù hợp hơn với những lí tưởng của mình. Chính sự nhiệt huyết đã truyền cảm hứng cho Wilson tiếp tục gắn bó với công việc: “Woodward tin rằng dữ liệu thống kê dù ở dạng hình ảnh hay con số đều quan trọng trong quá trình đánh giá cầu thủ. Ông ấy cũng dạy tôi rằng không phải lúc nào đi theo lối mòn mọi người vốn làm là đúng.”
Những nhân vật đi tiên phong trong việc áp dụng số liệu vào trận đấu tại Anh còn có Steve McClaren và Sam Allardyce. Cả hai đều ưu ái những nhân viên của Prozone và bổ nhiệm họ vào ban huấn luyện viên dội bóng. Không phải ngẫu nhiên mà trong khoảng thời gian 2002-07, thời điểm phân tích dữ liệu mới nhen nhóm tại Premier League, Middlesbrough và Bolton Wanderers là hai con ngựa ô của giải với thành tích vượt mong đợi.
Ngày nay, 19/20 câu lạc bộ tại Premier League sử dụng Prozone. Mỗi đội bóng đều trang bị cho mình những chuyên gia phân tích dữ liệu nhằm chọn lọc ra những cầu thủ tốt nhất, để từ đó đạt được mục tiêu tối thượng là giành những danh hiệu cao nhất.
HLV Arsene Wenger là người rất xem trọng các con số. Năm 2012, Arsenal đã mua lại một công ty dữ liệu có tên StatDNA với giá hơn 2 triệu Bảng Anh. Ảnh: Flickr
3h50 chiều ngày 19/3/1950, một nhân viên kế toán của Không lực Hoàng gia Anh tên Charles Reep có mặt trên khán đài để theo dõi trận đấu giữa Swindon Town và Bristol Rovers.
Trong lúc trận đấu diễn ra, ông lấy bút chì và ghi chú lại diễn biến bằng những kí hiệu vào cuốn sổ của mình. Nhiều năm trôi qua, Reep đã sở hữu kho dữ liệu đồ sộ của hơn 2,000 trận đấu. Ông sử dụng chúng vào phần phân tích sau trận, công việc thường khiến Reep mất hơn 80 giờ đồng hồ để hoàn tất. Riêng trận chung kết World Cup 1958 giữa Brazil và Thụy Điển, ông cần tới hơn 3 tháng.
Qua phân tích, Reep nhận thấy, dù mọi người hay cho rằng bóng đá là trò chơi khó đoán với những kết quả bất định, nó vẫn xuất hiện những quy luật nhất định. Ví dụ, bàn thắng sẽ đến sau mỗi 9 tình huống dứt điểm, 80% số bàn thắng đến sau những pha phối hợp ít hơn 4 chạm hay 50% số bàn đến từ những tình huống cướp bóng cách khung thành 30m.
Từ đó, Reep kết luận nếu các đội bóng giành ít thời gian đan bóng hơn và tập trung nhồi bóng vào khu vực phòng ngự đối phương, cơ hội ghi bàn sẽ cao hơn. Chiến thuật bóng dài vốn đặc trưng của nước Anh đến mức Pep Guardiola phải bất ngờ được ra đời từ đó.
Tuy nhiên, bóng dài có những hạn chế nhất định. Thứ nhất, đó không phải là một lối đá đẹp mắt cho lắm. Thứ hai, không gian mẫu cho phân tích của Reep là quá hẹp khi chỉ bao gồm các trận đấu diễn ra tại Anh Quốc mà bỏ qua những xu hướng bóng đá khác trên thế giới. Vào năm 2005, Ian Franks, Giáo sư Đại học British Columbia cùng nhà toán học điện tử Mike Hughes đã cùng xem xét lại dữ liệu thu thập được ở hai kì World Cup mà Charles Reep từng phân tích. Kết quả ban đầu khá tương đồng với nhận định của Reep, nhưng khi đi sâu hơn vào vấn đề, họ chỉ ra rằng các đội chuyền càng nhiều mới là bên có cơ hội ghi bàn lớn hơn (thứ triết lí ngày nay được đề cập rất nhiều qua cụm từ chúng ta đã quá quen thuộc, “tiki-taka”).
Hughes nói: “Reep là một kế toán mẫn cán, nhưng ông quên mất một sự thật rằng Brazil, đội vô địch thế giới hai lần liên tiếp không hề sử dụng chiến thuật bóng dài.” Nói một cách rộng hơn, Charles Reep đã không đặt số liệu vào những bối cảnh và giả định khác nhau như những nhà phân tích khác thường làm. Nhà kinh tế học đến từ Đại học Cornell - New York, Chris Anderson trong cuốn sách The Numbers Gamecủa mình viết: “Mục đích của Reep khi sử dụng những con số là để chứng minh góc nhìn của ông với bóng đá là đúng. Ông bỏ qua những nhận định và phong cách khác và vội vã đưa ra kết luận.” Từ sai lầm của Reep, chúng ta thấy thống kê dữ liệu có thể giúp đa chiều hóa góc nhìn của người xem bóng nói chung và các chuyên gia bóng đá nói riêng.
Charles Reep được xem là "cha đẻ" của triết lý bóng dài được bóng đá Anh áp dụng nhiều thập kỷ. Ảnh: Five Thirty Eight.
Khi Wilson gia nhập Manchester City vào năm 2006 trên cương vị đứng đầu mảng phân tích dữ liệu, ông lập tức thuê hàng loạt chuyên gia hàng đầu trong lĩnh vực này và đặt ra mục tiêu thay đổi bóng đá bằng việc sử dụng số liệu thống kê. Wilson nói: “Ở thời điểm đó, các huấn luyện viên thường chỉ ra vạch ra những đường kẻ trên bảng chiến thuật mà họ cho là hợp lí. Chúng không dựa theo một phương án chiến thuật hay căn cứ chính xác nào. Đội ngũ của tôi phải đấu tranh với thói quen đó và tạo ra một cách tiếp cận mới, thay đổi hoàn toàn lối nghĩ thường thấy.”
Tháng 9/2008, Manchester City được mua lại bởi Tập đoàn Abu Dhabi United Group (ADUG) vốn sở hữu bởi gia đình Hoàng gia Các tiểu Vương quốc Arab Thống nhất. Với tiềm lực tài chính khủng khiếp của dòng vàng đen sa mạc, không chỉ lực lượng cầu thủ là nơi được bơm tiền, mà đội ngũ phân tích của Wilson cũng được cung cấp điều kiện đầy đủ hơn để hoàn thành công việc.
Sau mỗi trận đấu, họ tập hợp để đưa ra những báo cáo về phong độ của đội bóng, sử dụng dữ liệu họ thu thập được. Họ giải mã số đường chuyền bị chặn, thời gian bao lâu để đoạt lại bóng. Họ đặc biệt tập trung vào thời gian kiểm soát bóng của City ở một phần ba sân đối thủ, thông số được cho là liên quan mật thiết với tỉ lệ thắng trận. Từ đó, Wilson đưa ra kết luận tỉ lệ chuyền thành công trong khu vực sân nhà đối phương càng cao, cầu thủ đó càng thích hợp hơn với đội bóng.
Nhưng như đã nói ở trên, dữ liệu cần đặt vào bối cảnh thích hợp. Thông số Wilson sử dụng để kết luận sẽ không phù hợp với những câu lạc bộ có phong cách chơi bóng khác biệt vậy nên thử thách thật sự cho những nhà phân tích là tìm ra thông số nào phù hợp nhất. “Lựa chọn đúng nguồn dữ liệu, thuật toán dữ liệu sẽ cho ra mối quan hệ mật thiết giữa thắng và thua.” Wilson nói.
Công nghệ càng phát triển, những thông số lại càng được đào sâu hơn. Các nhà phân tích không còn tin vào những dữ liệu thô, ví dụ như số km một cầu thủ chạy trong trận đấu để đo đạc sự hiệu quả. Thay vào đó, họ nhìn vào khoảng cách và tốc độ chạy trong từng khu vực cụ thể. Càng chi tiết, sự đánh giá về một cầu thủ lại càng chính xác. Từ nguyên lí đặt dữ liệu vào bối cảnh trận đấu, Prozone đã cho ra thông số có tên gọi “bàn thắng kì vọng”.
Họ gán cho mỗi tình huống dứt điểm ở những vị trí khác nhau một tỉ lệ nhất định và từ đó xác định được cầu thủ và đội bóng đó có thi đấu hiệu quả hay không. Bàn thắng kì vọng được tin cậy đến mức, Arsene Wenger từng phát biểu rằng ông nhìn vào thông số này để lựa chọn đội hình và chuyển nhượng cầu thủ. Dù vậy, luôn có những biến số mà thuật toán không thể tổng hợp. Những hành động như tắc bóng, phá bóng hay cứu thua có thể đo đếm bằng số lượng, nhưng việc bám người hay vị trí đứng của cầu thủ là những thứ được coi là vô hình trong thống kê.
Vậy nên chính bản thân Wilson cũng phải thừa nhận: “Phần lớn của chiến thắng nằm ở chất lượng cầu thủ. Nhưng tôi tin rằng sự chuẩn bị và tối đa hóa chất lượng đó nắm tới 50% tỉ lệ thành công.” Sau mỗi trận đấu của Manchester City ở mùa giải 2011-12, đội trưởng Vincent Kompany cùng các hậu vệ khác đều tổ chức một buổi họp với đội phân tích và tìm cách cải thiện màn trình diễn chung, sử dụng cả thông số cơ bản và băng hình tư liệu. Sự kết hợp cả hai yếu tố đó giúp cầu thủ tự nhìn ra thiếu sót của bản thân và đề ra được giải pháp giải quyết vấn đề dựa vào căn cứ số liệu.
Simon Wilson bỏ lỡ trận đấu cuối cùng của City mùa giải đó khi họ tiếp đón Queens Park Rangers trên sân nhà. Khi đó, City và láng giềng United đang bằng điểm nhau nhưng đội bóng áo xanh xếp trên nhờ hơn hiệu số bàn thắng bại. “Tôi phải bắt một chuyến bay, vì vậy tôi chỉ có thể xem hết hiệp 1. Chúng tôi dẫn 1-0 sau 45 phút đầu tiên, vì vậy tôi rất tự tin.” QPR ghi hai bàn và vươn lên dẫn trước sau đó, nhưng hai pha dứt điểm ở những phút bù giờ đã đem cướp ngôi vương khỏi tay Quỷ đỏ.
Ở tình huống ghi bàn quyết định của Sergio Aguero, tỉ lệ ghi bàn theo mô phỏng bàn thắng kì vọng của Prozone chỉ là 12%. Nhưng thay vì sút thẳng, tiền đạo người Argentina quyết định đi bóng đến sát vòng cấm địa hơn, tỉ lệ lúc này là 19%. Lúc Wilson hạ cánh xuống sân bay Gatwick, Manchester City đã là nhà vô địch Premier League.