SMILES (Simplified Molecular Input Line Entry System) adalah sistem representasi senyawa kimia dalam bentuk string teks linear yang dirancang untuk memudahkan input, penyimpanan, dan manipulasi struktur molekul menggunakan komputer. Dengan SMILES, struktur kimia kompleks dapat dituliskan dalam bentuk barisan karakter yang efisien dan mudah dibaca oleh mesin, tanpa kehilangan informasi penting mengenai atom, ikatan, dan topologi molekul.
SMILES dikembangkan pada 1980-an dan sejak itu menjadi salah satu format paling populer dalam kimia komputasi, database kimia, dan pemodelan molekuler, termasuk dalam machine learning dan QSAR (Quantitative Structure–Activity Relationship).
Cara Kerja SMILES
Representasi SMILES mendeskripsikan molekul berdasarkan urut-urutan atom dan jenis ikatan secara linear. Beberapa aturan dasar dalam SMILES:
-
Atom ditulis menggunakan simbol unsur kimia (misal: C untuk karbon, O untuk oksigen).
-
Ikatan digambarkan dengan simbol tertentu:
-
Ikatan tunggal:
-
(atau bisa dihilangkan) -
Ikatan ganda:
=
-
Ikatan rangkap tiga:
#
-
-
Cincin diindikasikan dengan angka (misalnya, benzena:
c1ccccc1
) -
Cabang atau percabangan dalam rantai ditulis dalam tanda kurung
( )
-
Aromatisitas ditulis dengan huruf kecil, seperti
c
untuk karbon aromatik
Contoh:
-
Etanol (CH₃CH₂OH):
CCO
-
Asam asetat (CH₃COOH):
CC(=O)O
-
Benzena:
c1ccccc1
Keunggulan SMILES
-
Sederhana dan ringkas – Mudah ditulis dan diolah dalam skrip atau pemrograman.
-
Kompatibel dengan berbagai software – Seperti RDKit, Open Babel, ChemAxon, dll.
-
Ideal untuk machine learning – SMILES dapat digunakan sebagai input teks dalam model AI (seperti RNN, Transformer, dll).
-
Mudah diparsing – Bisa dikonversi ke format lain seperti InChI, 3D struktur, dan graf molekuler.
Kelebihan dalam Pemodelan Kimia
SMILES memungkinkan ribuan bahkan jutaan senyawa kimia direpresentasikan secara komputasional, memudahkan pencarian, penyaringan (filtering), prediksi sifat molekul, hingga generasi senyawa baru secara otomatis (molecular generation) oleh algoritma deep learning.
Misalnya, dalam drug discovery berbasis AI, model dapat dilatih pada data SMILES untuk memprediksi aktivitas biologis atau bahkan merancang senyawa baru dengan sifat tertentu.
Kesimpulan
SMILES adalah bahasa universal dalam kimia komputasi modern. Dengan menyederhanakan representasi struktur molekul ke dalam format linear yang efisien dan mudah diproses, SMILES menjadi jembatan antara ilmu kimia tradisional dan teknologi digital seperti machine learning, big data, dan kecerdasan buatan.