Sebagai antisipasi UEFA Euro 2024 membangun, dunia sepak bola menantikan tim mana yang akan membawa pulang trofi. Sekelompok peneliti—Florian Felice, Andreas Groll, Lars Magnus Hvattum, Christophe Ley, Gunther Schauberger, Jonas Sternemann, dan Ahim Zeileis—telah memanfaatkan kekuatan pembelajaran mesin untuk memperkirakan hasil turnamen bergengsi ini. Studi komprehensif mereka menggunakan rangkaian pembelajaran mesin untuk memprediksi hasil dengan akurasi yang ditingkatkan.

Pendekatan Penelitian untuk Peramalan

1. Pengumpulan data

Para peneliti memulai dengan mengumpulkan data ekstensif tentang pertandingan Kejuaraan Eropa UEFA sebelumnya. Kumpulan data ini mencakup hasil pertandingan, statistik tim, metrik kinerja pemain, dan faktor relevan lainnya dari turnamen sebelumnya. Selain itu, mereka mengintegrasikan data tim terkini, seperti hasil pertandingan terkini, bentuk pemain, dan komposisi tim, untuk memastikan model mencerminkan informasi terbaru.

2. Rekayasa Fitur

Rekayasa fitur merupakan langkah penting dalam proses mereka, yang memungkinkan mereka mengekstrak variabel bermakna dari data mentah. Fitur utama yang dipertimbangkan dalam model ini meliputi:

  • Indikator kekuatan tim, seperti Peringkat FIFA dan peringkat Elo.
  • Pertunjukan sejarah di Turnamen UEFA.
  • Baru metrik kinerja, termasuk rasio menang/kalah dan perbedaan sasaran.
  • Statistik khusus pemain, seperti gol yang dicetak, assist, dan tindakan bertahan.

3. Pemilihan Model

Untuk meningkatkan keakuratan prediksi mereka, para peneliti menggunakan pendekatan ansambel, yang menggabungkan beberapa model pembelajaran mesin. Model utama yang digunakan dalam ansambel mereka meliputi:

  • Hutan Acak: Model serbaguna yang menangkap interaksi kompleks antar variabel.
  • Mesin Peningkat Gradien (GBM): Efektif untuk meningkatkan akurasi prediksi dengan berfokus pada kejadian yang sulit diprediksi.
  • Jaringan Syaraf: Mampu mendeteksi pola rumit dalam data.

Dengan menggabungkan model-model ini, ansambel ini memanfaatkan kekuatan masing-masing model, sehingga menghasilkan sistem prediksi yang lebih kuat dan andal.

4. Pelatihan dan Validasi Model

Model ansambel dilatih menggunakan data historis dari Kejuaraan Eropa UEFA sebelumnya. Untuk memvalidasi kinerja model, para peneliti menggunakan teknik validasi silang, memastikan model tersebut dapat digeneralisasi dengan baik pada data yang tidak terlihat. Langkah ini penting untuk menghindari overfitting dan memastikan bahwa model dapat memprediksi kecocokan di masa mendatang secara akurat.

5. Prediksi dan Analisis

Dengan model yang dilatih, para peneliti melakukan simulasi Turnamen UEFA Euro 2024 beberapa kali untuk menghasilkan perkiraan probabilistik untuk setiap pertandingan. Pendekatan ini tidak hanya memberikan prediksi untuk pertandingan individu tetapi juga memperkirakan kemungkinan setiap tim maju melalui tahapan dan pada akhirnya memenangkan turnamen.

Ekran Resmi 2024-06-14 16.25.34.png
Grafik lebar penuh interaktif

Siapa yang Akan Memenangkan Euro 2024?

Model ansambel pembelajaran mesin memungkinkan simulasi semua pertandingan di fase grup, menentukan tim mana yang melaju ke babak sistem gugur dan pada akhirnya memprediksi pemenangnya. Dengan menjalankan simulasi ini 100,000 kali, model menghasilkan probabilitas kemenangan untuk setiap tim.

Ekran Resmi 2024-06-14 16.25.23.png
Grafik lebar penuh interaktif

Hasilnya menunjukkan bahwa Prancis adalah favorit untuk memenangkan gelar Eropa, dengan kemungkinan menang 19.2%. Inggris menyusul dengan peluang 16.7%, dan tuan rumah Jerman memiliki 13.7%. Diagram batang di bawah menggambarkan probabilitas kemenangan untuk semua tim yang berpartisipasi, dengan informasi lebih rinci tersedia dalam versi interaktif lengkap.

Temuan Kunci

Ansambel pembelajaran mesin menghasilkan beberapa wawasan penting:

  • Favorit dan Underdog: Model ini menyoroti kekuatan sepak bola tradisional sebagai pesaing kuat sekaligus mengidentifikasi potensi kuda hitam yang dapat mengejutkan penggemar.
  • Pertandingan Kritis: Pertarungan tertentu di babak penyisihan grup dan babak sistem gugur diidentifikasi sebagai hal yang sangat penting, dengan hasil yang mungkin akan mempengaruhi kemajuan turnamen secara signifikan.
  • Dampak Pemain: Performa individu pemain, terutama dari posisi kunci, terbukti berdampak besar terhadap hasil pertandingan.

Kesimpulan

Pekerjaan dari Florian Felice, Andreas Groll, Lars Magnus Hvattum, Christophe Ley, Gunther Schauberger, Jonas Sternemann, dan Achim Zeileis menunjukkan kemampuan pembelajaran mesin yang kuat dalam memperkirakan hasil acara kompleks seperti UEFA Euro 2024. Pendekatan gabungan mereka, yang menggabungkan berbagai model pembelajaran mesin, memberikan sistem prediksi yang kuat dan akurat yang menawarkan wawasan berharga tentang potensi hasil turnamen.

Sumber Daya