Posted in

Memprediksi Fitur Spasial dan Spektral Resolusi Tinggi dalam Pencitraan Spektrometri Massa dengan Pembelajaran Mesin dan Fusi Data Multimodal

Memprediksi Fitur Spasial dan Spektral Resolusi Tinggi dalam Pencitraan Spektrometri Massa dengan Pembelajaran Mesin dan Fusi Data Multimodal
Memprediksi Fitur Spasial dan Spektral Resolusi Tinggi dalam Pencitraan Spektrometri Massa dengan Pembelajaran Mesin dan Fusi Data Multimodal

Abstrak
Kemajuan terkini dalam Pencitraan Spektrometri Massa Molekuler telah memicu minat dalam mengintegrasikan metode resolusi spasial tinggi dengan pencitraan kimia berbasis spektrometri massa molekuler. Algoritme berbasis fusi telah terbukti efektif dalam menghasilkan spektrum massa molekuler resolusi spasial tinggi. Namun, tantangan signifikan berasal dari mekanisme fisik yang berbeda yang mendasari pembuatan gambar dan teknik pengambilan sampel data, yang berpotensi menyebabkan perbedaan dalam saluran informasi terintegrasi. Mengintegrasikan kendala fisik ke dalam alur kerja pemrosesan data sangat penting untuk mengatasi masalah ini. Dalam studi ini, kami mengusulkan pendekatan inovatif yang menggabungkan data dari resonansi siklotron ion transformasi Fourier (FTICR), desorpsi/ionisasi laser berbantuan matriks waktu terbang, dan teknik pencitraan spektrometri massa ion sekunder waktu terbang. Dengan memanfaatkan resolusi spektral FT-ICR yang tak tertandingi dan resolusi spasial ToF-SIMS yang luar biasa, kami mencapai resolusi spasial submikron, yang memungkinkan pengamatan spesies molekuler utuh dengan presisi spektral yang luar biasa. Analisis korelasi kanonik digunakan untuk menggabungkan kendala fisik. Melalui pemrosesan gambar dan teknik pembelajaran mesin yang canggih, hasil penggabungan ini sangat menjanjikan untuk memajukan pemahaman kita tentang sistem yang kompleks dan mengungkap kerumitan molekuler yang tersembunyi.

1 Pendahuluan
Dalam beberapa tahun terakhir, perhatian signifikan telah diarahkan untuk memajukan platform Pencitraan Spektrometri Massa Molekuler (MSI) pada skala nano untuk mencapai resolusi subseluler. Bersamaan dengan itu, para peneliti telah mengeksplorasi pendekatan inovatif untuk menggabungkan pencitraan kimia berbasis spektrometri massa molekuler dengan modalitas pencitraan lain untuk memberikan informasi sampel tambahan yang dapat digunakan untuk meningkatkan informasi spasial yang dikumpulkan melalui MSI. Teknik-teknik ini mencakup beragam metode, mulai dari probe pemindaian [ 1 , 2 – 3 ], mikroskopi optik [ 4 , 5 ] hingga sistem elektron dan ion [ 6 , 7 ], yang masing-masing menyumbangkan kekuatan uniknya pada bidang pencitraan molekuler yang terus berkembang.

Salah satu pencapaian penting dalam upaya ini adalah pembuatan spektrum massa molekuler beresolusi spasial tinggi. Pencapaian ini dimungkinkan melalui penerapan algoritma berbasis fusi [ 8 , 9 – 10 ], yang menggabungkan data dari berbagai sumber dan modalitas, sehingga menciptakan profil molekuler yang komprehensif. Namun, meskipun menjanjikan, pendekatan ini menghadapi tantangan mendasar yang berasal dari mekanisme fisik yang berbeda yang mendasari pembuatan gambar untuk MSI dan teknik yang digunakan untuk upsampling data.

Divergensi dalam mekanisme dasar ini menimbulkan masalah kritis, yang menyebabkan potensi ketidaksesuaian antara saluran informasi terintegrasi. Algoritma ini bergantung pada asumsi korelasi antara berbagai saluran informasi tetapi tidak memiliki batasan berdasarkan hubungan yang diketahui. Akibatnya, keluaran algoritma tersebut rentan terhadap kesalahan rekonstruksi [ 11 ], yang merusak akurasi dan keandalan spektrum massa molekul yang dihasilkan.

Tinjauan terkini telah menyoroti minat yang semakin meningkat dalam fusi data biomedis multimodal, termasuk kombinasi modalitas radiologi, histologi, dan spektroskopi untuk meningkatkan karakterisasi penyakit dan akurasi prediksi [ 12 ]. Pendekatan ini mencakup skema fusi tingkat piksel, tingkat fitur, dan tingkat keputusan, yang sering kali memanfaatkan pembelajaran mendalam atau pemodelan statistik untuk menggabungkan pencitraan komplementer atau data spektral. Namun, sebagian besar pekerjaan yang ada difokuskan pada radiologi (misalnya, MRI/CT, ​​PET/MRI) atau spektroskopi optik, dengan eksplorasi terbatas fusi multimodal dalam spektrometri massa pencitraan (IMS) khususnya untuk menggabungkan resolusi spasial dari satu modalitas dengan kekayaan kimia dari modalitas lain.

Mengintegrasikan kendala fisik ke dalam alur kerja pemrosesan data sangat penting untuk mengatasi tantangan ini dan membuka potensi penuh penggabungan beberapa saluran informasi untuk aplikasi ilmiah. Dengan memasukkan kendala ini, peneliti dapat menjembatani kesenjangan antara berbagai modalitas pencitraan dan meningkatkan ketepatan integrasi data molekuler, yang pada akhirnya membuka jalan bagi teknik analisis molekuler yang lebih kuat dan akurat di masa mendatang.

Dalam studi ini, kami mengeksplorasi pendekatan inovatif yang menggabungkan data dari tiga teknik pencitraan MSI yang berbeda: Fourier transform ion cyclotron resonance (FT-ICR), time-of-flight matrix-assisted laser desorption/ionization (MALDI-ToF), dan time-of-flight secondary ion mass spectrometry (ToF-SIMS). Dengan menggabungkan resolusi spektral FT-ICR yang luar biasa dengan resolusi spasial ToF-SIMS yang luar biasa, tujuannya adalah untuk mencapai resolusi spasial submikron, yang memungkinkan kami untuk mengamati spesies molekul utuh dengan presisi spektral yang tinggi. Penggabungan modalitas pencitraan ini menjanjikan untuk memajukan pemahaman kita tentang sistem yang kompleks dan mengungkap detail molekul tersembunyi melalui pemrosesan gambar dan teknik pembelajaran mesin yang canggih.

Sementara penelitian sebelumnya telah mengeksplorasi fusi data multimoda dalam pencitraan klinis (misalnya, MRI-CT, PET-MRI) dan spektroskopi optik, hanya sedikit yang membahas tantangan unik fusi MSI multimoda, di mana dimensi spektral dan spasial berdimensi tinggi dan jarang terisi. Berbeda dengan pendekatan berbasis pembelajaran mendalam, yang memerlukan kumpulan data berlabel besar dan sulit ditafsirkan, metode kami mengintegrasikan NMF renggang untuk ekstraksi komponen tanpa pengawasan dan analisis korelasi kanonik (CCA) untuk penyelarasan fitur lintas-moda dan peningkatan resolusi. Pendekatan ini dibangun di atas fusi tingkat fitur klasik tetapi memperkenalkan kombinasi baru metode statistik yang dapat ditafsirkan yang disesuaikan untuk MSI.

2 Metode
Alur kerja dimulai dengan menerapkan Non-Negative Matrix Factorization (NMF) yang jarang [ 13 ] ke ketiga modalitas. Set data tiga dimensi ini, yang berisi tanda tangan spektral di setiap titik koordinat sebagai dimensi ketiga, disimpan dalam format jarang yang hemat ruang. Selama proses NMF, set data MALDI-TOF dan ToF-SIMS diambil sampelnya kembali untuk diselaraskan dengan resolusi spektral FT-ICR, sehingga ketiga modalitas memiliki resolusi spektral tertinggi. Selanjutnya, alur kerja pembelajaran mesin berbasis Python digunakan untuk memproses dan mendaftarkan bersama set data gabungan ini. Setelah pendaftaran berhasil, CCA [ 14 ] menyempurnakan gambar MSI FT-ICR resolusi rendah agar sesuai dengan resolusi ToF-SIMS resolusi tinggi dengan mempelajari korelasi antara modalitas ini. Pekerjaan serupa telah dilakukan dengan memanfaatkan MALDI-TOF dan ToF-SIMS di [ 15 ]. Di sini, kami telah memanfaatkan FT-ICR untuk mendapatkan resolusi spektral yang lebih baik.

2.1 Kumpulan Data
Jaringan otak beku segar diperoleh dari model tikus kontrol berdasarkan protokol IACUC yang disetujui secara institusional. Irisan jaringan disiapkan pada ketebalan 10 μm menggunakan kriostat CM1950 (Leica Biosystems, Nussloch, Jerman) dan dipasang langsung pada slide kaca berlapis InTiO (576352, Sigma–Aldrich, Missouri, AS) untuk eksperimen pencitraan. 5-Diaminonaphthalene (DAN; 56451, Millipore Sigma) disiapkan pada konsentrasi 4,39 mg/mL dalam campuran 2:2:1 (v/v) air, etanol, dan asam klorida, mengikuti protokol yang diterbitkan sebelumnya (PMID: 37584601, 39499201, 37929637). Matriks DAN-HCl diendapkan secara seragam menggunakan penyemprot M5 (HTX Technologies LLC, North Carolina, AS). Pencitraan spektrometri massa (MSI) dilakukan menggunakan timsTOF fleX (Bruker Daltonics, Billerica, MA) dan 15 T solariX XR FT-ICR MS (Bruker Daltonics, Billerica, MA). Semua analisis dilakukan dalam mode ion negatif. Resolusi spasial adalah 50 μm untuk timsTOF fleX dan 100 μm untuk FT-ICR MS. Kalibrasi massa dilakukan menggunakan Agilent Tune Solution (G1969−85000, Agilent Technologies, California, AS). Data MSI diekspor dari lab SCiLS 2020a (Bruker, Bremen, Jerman) dalam format standar imzML dan dikonversi ke format HDF5 untuk analisis pembelajaran mesin.

Studi ToF-SIMS dilakukan menggunakan instrumen ToF-SIMS5 – NSC (ION.TOF Gmb). Pistol ion logam cair Bi3+ (energi 30 keV, arus 0,5 nA dalam mode DC, ukuran titik 120 nm) digunakan sebagai sumber ion primer untuk ekstraksi ion sekunder dari sampel jaringan yang dipelajari. Gambar tersebut di-raster di area 500 × 500 μm, dengan pemindaian tambahan oleh tahap mekanis. Pemindaian yang diperoleh selanjutnya dijahit bersama untuk membentuk gambar akhir berukuran 19 × 11 mm 2 dengan resolusi 9600 × 5600 piksel. Pistol banjir elektron berenergi rendah telah digunakan selama pengukuran untuk kompensasi muatan.

2.2 NMF Jarang
Ketiga set data tersebut berkisar antara 240 gigabita hingga 2,2 terabita. Oleh karena itu, teknik reduksi dimensi diperlukan untuk menjalankan analisis komputasional dengan sukses. NMF dipilih karena sifatnya yang non-negatif. Dalam kasus ini, mengapa NMF jarang digunakan sebagai pengganti NMF tradisional dijelaskan di bawah ini. Kami mengambil pendekatan yang sama untuk melakukan NMF Jarang untuk data FT-ICR, ToF-SIMS, dan MALDI-TOF. Prosedur dan hasil NMF jarang untuk ketiga set data dijelaskan di bawah ini.

2.2.1 FT-ICR
Dataset FT-ICR dikumpulkan dari beberapa irisan otak tikus. Dataset itu sendiri adalah tiga dimensi, karena dikumpulkan dari wilayah spasial beberapa milimeter, dan pada setiap titik yang dikumpulkan, ada tanda spektral yang terkait dengan data. Namun, data ini disimpan dalam format sparse. Seperti yang ditunjukkan pada Gambar 1a , spektrum tidak dikumpulkan dari setiap lokasi. Wilayah hitam adalah wilayah yang tidak ada spektrum yang dikumpulkan. Jadi, meskipun dimensi spasial gambar pada Gambar 1a adalah 238 × 672 = 159936, spektrum hanya ada dari 72078 posisi, atau sekitar 45% posisi.

GAMBAR 1
Buka di penampil gambar
Kekuatan Gambar
Komponen Spektral FT-ICR. (a) Spektrum yang dijumlahkan dari data FT-ICR yang dikumpulkan, dengan irisan otak tikus yang terlihat. (b) Spektrum yang dikumpulkan pada titik yang ditandai sebagai Koordinat 1. (c) Spektrum yang dikumpulkan pada titik yang ditandai sebagai Koordinat 2. (d) Spektrum yang dikumpulkan pada titik yang ditandai sebagai Koordinat 3.
Spektrum dari tiga lokasi berbeda, ditandai dengan titik-titik pada Gambar 1a , ditunjukkan pada Gambar 1b–d . Selain itu, data dikumpulkan dan disimpan dalam format sparse untuk setiap spektrum guna menghemat ukuran data. Hal ini dapat dipahami dengan melihat spektrum pada Gambar 1b–d , di mana banyak intensitas untuk nilai m/z yang lebih tinggi , khususnya untuk nilai di atas 1000, adalah nol. Dengan demikian, perbandingan menjadi sangat menantang untuk kumpulan data tersebut, karena setiap spektrum dapat dan akan sering memiliki serangkaian nilai m/z yang unik . Salah satu cara mengatasinya adalah dengan mengisi nilai yang hilang dengan nol dan menghasilkan kumpulan data tiga dimensi yang terisi, di mana dua dimensi bersifat spasial dan yang ketiga bersifat spektral. Namun, kumpulan data tersebut dengan cepat menjadi sangat besar dan sering kali tidak dapat dimuat dalam memori. Misalnya, ketika disimpan dalam format sparse seperti yang baru saja dijelaskan, kumpulan data yang dimaksud berukuran sekitar 5 GB, sedangkan data yang terisi berukuran lebih dari seratus kali lebih besar, dengan sebagian besar peningkatan berasal dari pengisian nilai spektral yang hilang. Kumpulan data sebesar itu hampir mustahil dimasukkan ke dalam memori dan sangat lambat untuk dianalisis.

Untuk mengatasi hal ini, kami menerapkan sparse non-negative matrix factorization (Sparse NMF) menggunakan paket Tensorly Python. Langkah pertama melibatkan pembuatan sumbu m/z yang konsisten . Kami menghitung jarak bukan nol minimum antara semua nilai m/z di seluruh kumpulan data dan menggunakannya sebagai faktor penskalaan untuk mendiskritisasi nilai m/z ke dalam grid binning tetap. Langkah ini memastikan penyelarasan spektral sambil mempertahankan resolusi.

Selanjutnya, kami membangun matriks koordinat sparse untuk merepresentasikan data. Untuk setiap nilai intensitas bukan nol, kami mencatat triplet: ( x , y , m/z scaled ), di mana x dan y menunjukkan koordinat spasial, dan m/z scaled adalah indeks bin m/z yang didiskritkan . Kami kemudian memetakan setiap pasangan ( x , y ) ke indeks spasial 1D yang unik menggunakan transformasi linear z  =  x  +  y  ×  y max . Hal ini memungkinkan kami untuk merepresentasikan data sebagai matriks 2D sparsepersamaan matematika, di mana Z adalah jumlah lokasi spasial unik (72.078) dan M adalah jumlah bin m/z unik (9.711).

Matriks jarang inipersamaan matematikaditeruskan ke backend sparse Tensorly, yang mendukung operasi asli pada data berformat koordinat. Kami menerapkan Sparse NMF untuk menguraikanpersamaan matematikamenjadi dua matriks non-negatif:persamaan matematikaDanpersamaan matematika, Di manapersamaan matematikaadalah jumlah komponen laten. Di sini,persamaan matematikaberisi muatan spasial, danpersamaan matematikaberisi tanda tangan spektral yang sesuai.

Setiap komponen NMF dapat diinterpretasikan sebagai sekumpulan puncak m/z yang diekspresikan bersama (fitur kimia laten). Peta spasial menunjukkan di mana kombinasi fitur m/z ini paling umum dalam jaringan. Informasi Pendukung Gambar S1 menunjukkan dua komponen NMF dan spektrum terkaitnya yang dihitung menggunakan proses NMF renggang yang dibahas sebelumnya. Informasi Pendukung Gambar S2 menunjukkan peta spasial dan spektral yang dijumlahkan dari 40 komponen NMF.

2.2.2 ToF-SIMS
Seperti data FT-ICR, data ToF-SIMS adalah kumpulan data tiga dimensi dengan tanda spektral yang dikaitkan pada setiap titik spasial. Data ini juga disimpan dalam format sparse. Sekali lagi, seperti yang terlihat sebelumnya dengan data FT-ICR, spektrum ToF-SIMS tidak dikumpulkan dari setiap lokasi. Kami menggunakan langkah-langkah yang diambil dengan data FT-ICR untuk kumpulan data ini untuk melakukan NMF sparse dengan paket Tensorly. Langkah-langkah tersebut menghasilkan matriks sparse dengan 2559964 × 769 komponen, berukuran 6,3 GB untuk data ToF-SIMS. Satu hal penting yang perlu dicatat di sini adalah bahwa kami menggunakan nilai m/z dari pengukuran FT-ICR sebagai sumbu referensi, terutama karena dua alasan: FT-ICR memberikan resolusi massa tertinggi di antara ketiga modalitas, dan menggunakan referensi yang konsisten memungkinkan penyelarasan puncak di seluruh instrumen untuk fusi hilir. Untuk mencapai hal ini, semua spektrum dari MALDI-ToF dan ToF-SIMS disampel ulang ke sumbu m/z FT-ICR melalui binning. Secara khusus, rentang m/z umum (misalnya, 100–1000) ditetapkan, dan nilai intensitas diagregasi ke dalam bin menggunakan posisi bin FT-ICR. Tidak ada interpolasi atau penghalusan yang diterapkan; ini memastikan pelestarian bentuk puncak asli dan meminimalkan pengenalan artefak. Sebelum pengambilan sampel ulang, semua spektrum dikoreksi garis dasar dan dinormalisasi ke arus ion total (TIC). Kami memverifikasi bahwa pendekatan ini mempertahankan struktur puncak karakteristik dan memungkinkan komponen NMF yang dapat diinterpretasikan secara kimia di seluruh modalitas, seperti yang ditunjukkan dalam Informasi Pendukung Gambar S1–S6. Mengenai hasil NMF jarang yang dilakukan pada data ToF-SIMS, kami menunjukkan dua gambar serupa yang sebelumnya ditunjukkan dengan data FT-ICR. Informasi Pendukung Gambar S3 menunjukkan dua komponen NMF dan spektrumnya yang sesuai. Informasi Pendukung Gambar S4 menunjukkan peta spasial dan spektral total dari 40 komponen NMF.

2.2.3 ToF MALDI
MALDI-TOF juga merupakan kumpulan data tiga dimensi dan disimpan dalam format sparse. Dimensi spasial gambar adalah 2329 × 5054 = 11770766; spektrum ada dari 2030712 posisi atau hanya 17,25% dari posisi. Untuk kumpulan data ini, kami menggunakan langkah yang sama seperti yang dibahas sebelumnya untuk melakukan sparse NMF dengan paket Tensorly. Langkah-langkah tersebut menghasilkan matriks sparse dengan 2030712 × 596787 komponen, berukuran 11 TB untuk data MALDI-TOF. Sekali lagi, kami menggunakan nilai m/z dari pengukuran FT-ICR. Kami memilih 40 komponen untuk dekomposisi, jadi sementara matriks renggang A adalah matriks peringkat 2030712 × 596787, W adalah matriks peringkat 2030712 × 40, dan H adalah matriks peringkat 596787 × 40. Informasi Pendukung Gambar S5 menunjukkan dua komponen NMF dan yang sesuai. Gambar S6 menunjukkan peta spasial dan spektral yang dijumlahkan dari 40 komponen NMF.

2.3 Penghapusan Grid ToF-SIMS
Selama NMF, artefak grid terlihat untuk data ToF-SIMS seperti yang terlihat pada Gambar Informasi Pendukung S3a dan S4a. Karena masalah pemindaian, kita dapat melihat petak persegi 80 × 80 pada gambar spektrum ToF-SIMS yang dijumlahkan pada Gambar 2a . Karena ToF-SIMS adalah kumpulan data tiga dimensi dengan komponen spektral, gambar ini diproduksi dengan menjumlahkan dimensi spektral, menghasilkan gambar dua dimensi 2000 × 1280, dengan 400 petak persegi 80 × 80. Seperti yang dapat kita lihat dari gambar, petak-petak ini memiliki fungsi yang serupa, yang bertindak sebagai artefak selama proses NMF dan CCA yang jarang. Kami mengadopsi alur kerja berikut untuk menghilangkan artefak grid ini dan menghasilkan hasil yang lebih baik.

Kami mendapatkan 400 petak dari gambar dan mengambil rata-rata untuk mendapatkan rata-rata aritmatika berukuran (1 × 80 × 80) seperti yang ditunjukkan pada Gambar 2b . Petak rata-rata aritmatika ini ditumpuk untuk mendapatkan gambar dua dimensi dengan ukuran yang sama seperti aslinya, ditunjukkan pada Gambar 2c . Kemudian, kami mengurangi larik 2D Gambar 2c dari larik 2D asli Gambar 2a untuk mendapatkan gambar yang dihasilkan dengan menghilangkan artefak grid yang ditunjukkan pada Gambar 2d . Kemudian, kami memeriksa apakah proses ini berfungsi untuk semua nilai di sepanjang dimensi spektral. Ini berfungsi untuk semua nilai m/z . Setelah menghilangkan artefak grid untuk setiap nilai m/z , kami menumpuk semua gambar 2D yang dihasilkan untuk mendapatkan dataset ToF-SIMS tiga dimensi akhir yang digunakan dalam tahap NMF dan CCA.

GAMBAR 2
Buka di penampil gambar
Kekuatan Gambar
Penghapusan artefak grid dari kumpulan data ToF-SIMS. (a) Citra asli – Citra spasial 2D dengan menjumlahkan sepanjang dimensi spektral kumpulan data ToF-SIMS. (b) Rata-rata aritmatika dari 400 petak dari (a) berukuran 80×80. (c) Menumpuk petak rata-rata aritmatika untuk mendapatkan citra 2D berukuran sama dengan citra asli. (d) Citra yang dihasilkan setelah penghapusan grid.
2.4 Pendaftaran Bersama
Bahasa Indonesia: Setelah melakukan Sparse NMF, penampang jaringan umum antara tiga modalitas didaftarkan bersama menggunakan model transformasi afin yang dilatih dalam Pytorch. Pertama, kami mendaftarkan data FT-ICR ke data MALDI-TOF karena MALDI-TOF memiliki resolusi lebih tinggi daripada FT-ICR tetapi resolusi lebih rendah daripada data ToF-SIMS secara spasial. Kedua, kami mendaftarkan data MALDI-TOF ke data ToF-SIMS. Kami mendapatkan masker biner individual untuk semua penampang jaringan yang ada dalam gambar spasial dengan menggunakan operasi not logis diikuti oleh dilatasi biner. Kami menggunakan operasi biner fill-holes dari Scipy untuk melakukan ini. Kemudian, kami menggunakan masker yang dihasilkan untuk mendapatkan penampang jaringan umum antara dua modalitas data (mis., FT-ICR dan MALDI-ToF). Selanjutnya, kami memotong dan mengubah ukuran penampang jaringan umum agar memiliki dimensi spasial yang sama. Umumnya, kami melakukan downsampling dengan anti-aliasing. Misalnya, bagian jaringan MALDI-TOF, dengan dimensi spasial 700 × 975 piksel, diturunkan sampelnya agar sesuai dengan bagian jaringan FT-ICR yang sesuai dengan resolusi spasial 65 × 97 piksel.

Untuk menyelaraskan modalitas pencitraan secara spasial, kami menerapkan pendekatan registrasi benda kaku yang diterapkan di PyTorch. Daripada mengandalkan pustaka registrasi gambar tradisional, kami merumuskan transformasi sebagai masalah pengoptimalan yang dapat dibedakan melalui matriks transformasi afin 2D. Hal ini memungkinkan kami untuk secara langsung mengoptimalkan penyelarasan spasial menggunakan penurunan gradien.

Mengingat dua gambar (misalnya, masker jaringan atau peta intensitas ion skala abu-abu) yang direpresentasikan sebagai tensor PyTorch, pertama-tama kami mengubah ukuran satu gambar agar sesuai dengan dimensi modalitas referensi. Kemudian kami menginisialisasi matriks transformasi afin 2Dmathematical equationterdiri dari parameter rotasi dan translasi. Secara spesifik, M mencakup satu parameter rotasi θ dan dua parameter translasi ( T x , T y ). Transformasi afin yang sesuai diterapkan menggunakan operasi pengambilan sampel grid yang dapat dibedakan:
mathematical equation
Untuk mengoptimalkan M , kami meminimalkan kerugian berdasarkan kesamaan kosinus:

mathematical equation
di mana output adalah gambar bergerak yang telah ditransformasikan dan referensi adalah gambar tetap. Optimasi dilakukan menggunakan penurunan gradien stokastik (SGD) dengan tingkat pembelajaran 0,01 untuk 1000 iterasi. Metode ini menghasilkan matriks transformasi kaku yang menyelaraskan gambar bergerak dengan referensi.
Yang penting, meskipun diterapkan dalam PyTorch untuk fleksibilitas dan diferensiabilitas, proses registrasi ini pada prinsipnya setara dengan registrasi kaku klasik dengan minimisasi fungsional. Setelah pelatihan, kami menggunakan matriks transformasi yang telah dilatih untuk mendaftarkan bagian jaringan dengan bagian jaringan referensi. Perhatikan bahwa meskipun fiducial ToF-SIMS membantu dalam akuisisi dan penyambungan pindaian yang akurat, fiducial tersebut tidak digunakan untuk registrasi lintas modalitas.

Hasil awal menunjukkan registrasi yang baik antara irisan dari modalitas yang berbeda. Komponen NMF dari bagian jaringan yang terdaftar ini sesuai dengan puncak yang muncul bersamaan dalam mode yang sesuai. Mereka mungkin terkait dengan satu atau lebih senyawa kimia dalam sampel. Hasil dari proses registrasi bersama ini ditunjukkan pada Gambar Informasi Pendukung S7 di mana bagian jaringan referensi FT-ICR digunakan untuk mendaftarkan bersama bagian jaringan MALDI-TOF. Selain itu, kami menunjukkan bagian jaringan MALDI-TOF yang diambil sampelnya dan asli setelah registrasi dengan dimensi spasialnya bersama dengan bagian jaringan FT-ICR referensi pada Gambar Informasi Pendukung S8. Kami hanya menunjukkan satu komponen NMF dari 40 komponen di sini.

Data MALDI-TOF digunakan dengan cara yang sama dalam proses pendaftaran bersama untuk mendaftarkan data ToF-SIMS. Informasi Pendukung Gambar S9 menunjukkan pendaftaran bersama dari potongan jaringan ToF-SIMS dengan potongan jaringan referensi MALDI-TOF.

Semua langkah pendaftaran bersama dilakukan antara modalitas yang dikumpulkan dari bagian jaringan yang sama atau bagian yang berdekatan, memastikan korespondensi anatomi di seluruh kumpulan data. Ini menjamin bahwa dekomposisi NMF berikutnya dan fusi berbasis CCA valid secara biologis dan hanya terjadi antara daerah yang selaras secara spasial dan cocok secara anatomi.

2.5 Analisis Korelasi Kanonik (CCA)
CCA adalah alat statistik untuk memeriksa hubungan antara dua set variabel dengan mengidentifikasi kombinasi linear yang dikenal sebagai variabel kanonik yang memaksimalkan korelasinya. Dalam konteks penelitian ini, modul CCA dari pustaka Scikit-learn digunakan, memanfaatkan pengaturan default dan menentukan 40 komponen.

Bahasa Indonesia: Setelah registrasi data, CCA dimanfaatkan untuk membedakan hubungan fisik di antara berbagai modalitas MSI, yang memungkinkan prediksi gambar MSI FT-ICR resolusi rendah menjadi ToF-SIMS resolusi tinggi. Proses ini berlangsung dalam dua tahap: awalnya, CCA diterapkan pada data FT-ICR dan MALDI-TOF, memfasilitasi prediksi potongan jaringan FT-ICR resolusi rendah ke resolusi MALDI-TOF. Selanjutnya, pada langkah kedua, CCA sekali lagi digunakan, kali ini dengan data TOF-SIMS, memanfaatkan peta FT-ICR yang diprediksi yang diperoleh pada langkah sebelumnya untuk mencapai resolusi spasial pada resolusi TOF-SIMS. Pendekatan iteratif ini menghasilkan kumpulan data yang dicirikan oleh informasi spasial dan spektral yang tinggi. Melalui aplikasi CCA berurutan ini, penelitian ini bertujuan untuk mengungkap hubungan rumit antara berbagai modalitas MSI dan meningkatkan resolusi keseluruhan dari data yang diperoleh.

3 Hasil
Hasil dari langkah pertama CCA ditunjukkan pada Gambar 3 , di mana Gambar 3a,c,e menunjukkan komponen NMF pertama, kedua, dan kelima belas dari empat puluh data FT-ICR asli. Kolom kedua Gambar 3b,d,f menunjukkan komponen NMF yang sesuai dari data FT-ICR yang diprediksi pada resolusi MALDI-TOF. Di sini, kita dapat melihat bahwa CCA menangkap hubungan fisik antara FT-ICR dan MALDI-TOF dan memprediksi komponen NMF dengan benar pada resolusi tinggi. Colorbar yang sama digunakan untuk memplot komponen-komponen ini. Komponen NMF yang diprediksi dari ketiga komponen memiliki profil intensitas yang sama dengan komponen NMF asli.

GAMBAR 3
Buka di penampil gambar
Kekuatan Gambar
Prediksi FT-ICR pada resolusi MALDI-TOF menggunakan CCA. (a), (c), dan (e) menunjukkan tiga komponen NMF FT-ICR asli. (b), (d), dan (f) menunjukkan komponen terkait dari prediksi FT-ICR pada resolusi MALDI-TOF. Bagian yang diperbesar dari komponen asli dan prediksi ditampilkan di atas untuk menunjukkan fitur yang ditingkatkan.
Pada langkah kedua, kami menggunakan komponen NMF yang diprediksi pada resolusi MALDI-TOF, mendaftarkannya dengan komponen NMF ToF-SIMS, dan kemudian menjalankan algoritma CCA. Hasil dari langkah kedua CCA ditunjukkan pada Gambar 4 di mana Gambar 4a,c,e menunjukkan komponen NMF kedua, kedelapan, dan ketujuh belas dari empat puluh komponen NMF asli pada resolusi MALDI-TOF. Kolom kedua Gambar 4b,d,f menunjukkan komponen NMF yang diprediksi terkait pada resolusi ToF-SIMS. Sekali lagi, terlihat di sini bahwa CCA dengan benar menangkap hubungan fisik antara kedua modalitas data ini dan memprediksi komponen NMF pada resolusi tinggi. Colorbar yang sama digunakan untuk memplot komponen-komponen ini. Komponen NMF yang diprediksi dari ketiga komponen tampaknya menangkap profil intensitas sebagai komponen NMF asli dengan benar.

GAMBAR 4
Buka di penampil gambar
Kekuatan Gambar
Prediksi pada resolusi ToF-SIMS menggunakan CCA. (a), (c), dan (e) menunjukkan tiga komponen NMF asli pada resolusi MALDI-TOF. (b), (d), dan (f) menunjukkan komponen yang sesuai dari komponen NMF yang diprediksi pada resolusi ToF-SIMS.
Selain itu, hasil CCA diuji terhadap puncak m/z , dan estimasi spektral untuk prediksi juga diamati. Gambar 5 menunjukkan peta 790,8273 m/z untuk data FT-ICR asli dan data prediksi pada resolusi MALDI-TOF dan ToF-SIMS. Di sini, nilai m/z 790,8273 ± 5 digunakan untuk mendapatkan gambar rata-rata seperti yang ditunjukkan pada Gambar 5a–c . Sekali lagi, kita dapat melihat profil intensitas yang sama di antara ketiga modalitas. Juga, estimasi spektral rata-rata untuk area tertentu dari ketiga modalitas (ditunjukkan dalam warna hijau untuk FT-ICR, merah untuk MALDI-ToF, dan biru untuk ToF-SIMS) dihitung dan diplot pada Gambar 5d–f . Meskipun ada sedikit ketidakcocokan intensitas dalam estimasi spektral, puncak terlihat diprediksi dengan benar untuk prediksi MALDI-TOF dan ToF-SIMS. Ini menunjukkan potensi untuk mengungkap distribusi molekuler yang rumit pada resolusi spasial dan spektral yang tinggi.

GAMBAR 5
Buka di penampil gambar
Kekuatan Gambar
Prediksi puncak dengan data prediksi pada m/z 790.8273. (a)–(c) menunjukkan FT-ICR asli, masing-masing diprediksi pada resolusi MALDI-TOF dan diprediksi pada resolusi ToF-SIMS. (d)–(f) menunjukkan estimasi spektral rata-rata yang sesuai untuk tiga modalitas yang dihitung dari kotak persegi panjang berwarna hijau, merah, dan biru.

4 Kesimpulan
Investigasi ini menunjukkan kekuatan fusi data pencitraan spektrometri massa, yang menghasilkan resolusi spasial submikron dan spektral tinggi untuk sampel biologis yang kompleks. Menggabungkan modalitas FT-ICR, MALDI-ToF, dan ToF-SIMS dengan pemrosesan gambar canggih dan teknik pembelajaran mesin seperti CCA menghasilkan hasil yang luar biasa, terutama dalam analisis otak tikus. Arah masa depan mencakup perluasan ke lebih banyak bagian jaringan dan pembuatan rekonstruksi 3D lengkap dari seluruh otak tikus, yang menjanjikan terobosan dalam ilmu saraf dan seterusnya. Sementara studi saat ini difokuskan pada wilayah jaringan terbatas untuk menunjukkan jalur fusi kami, kami mengakui bahwa cakupan anatomi yang lebih luas dan persiapan sampel yang dioptimalkan akan menjadi penting dalam pekerjaan mendatang untuk sepenuhnya mewujudkan interpretabilitas biologis dari data MSI resolusi tinggi yang digabungkan. Menerapkan metodologi ini ke wilayah yang lebih beragam secara struktural, seperti lapisan hipokampus atau kortikal, akan memungkinkan wawasan yang lebih dalam tentang heterogenitas molekuler dan organisasi spasial di seluruh jaringan yang kompleks. Fleksibilitas metodologi ini memungkinkan integrasi saluran pencitraan tambahan yang mulus, yang memungkinkan investigasi multimoda komprehensif yang penting untuk wawasan yang lebih mendalam di seluruh domain ilmiah. Selain itu, kemampuan adaptasi pendekatan ini membuka jalan bagi kolaborasi lintas disiplin ilmu, yang mendorong upaya penelitian interdisipliner yang mendorong batas-batas pemahaman kita tentang sistem yang kompleks. Karena penelitian ini membuka jalan bagi pemahaman yang lebih holistik tentang lanskap biologi dan kimia, penelitian ini mengkatalisasi kemajuan transformatif dengan implikasi yang luas bagi ilmu material, penelitian farmasi, dan seterusnya. Dengan demikian, karya ini mengungkap penemuan langsung dan mendorong kita menuju masa depan di mana presisi dan kedalaman mendefinisikan ulang eksplorasi kita terhadap interaksi yang rumit dalam sistem yang kompleks.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *