Tutkijat Käyttävät Vähemmän Kuin 1% Suuren Hadronin Kolarittajan Keräämistä Tiedoista - Vaihtoehtoinen Näkymä

Tutkijat Käyttävät Vähemmän Kuin 1% Suuren Hadronin Kolarittajan Keräämistä Tiedoista - Vaihtoehtoinen Näkymä
Tutkijat Käyttävät Vähemmän Kuin 1% Suuren Hadronin Kolarittajan Keräämistä Tiedoista - Vaihtoehtoinen Näkymä

Video: Tutkijat Käyttävät Vähemmän Kuin 1% Suuren Hadronin Kolarittajan Keräämistä Tiedoista - Vaihtoehtoinen Näkymä

Video: Tutkijat Käyttävät Vähemmän Kuin 1% Suuren Hadronin Kolarittajan Keräämistä Tiedoista - Vaihtoehtoinen Näkymä
Video: Näin laadit tietosuoja-asetuksen mukaisen selosteen henkilötietojen käsittelystä -webinaari 2024, Huhtikuu
Anonim

On selvää, kun tieteellisen tiedon hankkimisessa on ongelmia. Mutta osoittautuu, että niiden tallentamiseen ja käsittelemiseen on ongelma.

Koko törmäysaineen kanssa tehtyjen korkean profiilin löytösarjojen sarja perustui tietoanalyysiin, jonka määrä on alle yksi prosentti tuotetun datan kokonaismäärästä.

Loput tiedot menetetään peruuttamattomasti.

26,7 kilometrin kolaritunnelia käytetään hiukkasten kiihdyttämiseen lähellä valon nopeutta. Kaksi vastakkaisiin suuntiin liikkuvat hiukkasvirrat törmäävät avaruuspisteisiin, joita herkät anturit valvovat. Jopa 120 miljardin protonin sisältävien protonipalkkien alhaisimmalla tiheysasteella törmäysten lukumäärä on 30 miljoonaa törmäystä sekunnissa.

Euroopan ydintutkimusjärjestön CERN: n verkkosivustolla julkaistun tiedon mukaan miljardi törmäystä sekunnissa luo tietovirtaksi 1 petatavua sekunnissa. Ja tämä on suurin ongelma tällä hetkellä, koska tällaisen nopeuden tietovirtaa on yksinkertaisesti mahdoton tallentaa, puhumattakaan siitä, että käsittelemme sitä oikein.”Vähintään 30 miljoonan törmäyksen yhteydessä tarvitaan 2000 petatavua tyypillisen 12 tunnin kolliderivaiheen tulosten tallentamiseksi. Kun 150 törmäyslaitteen käynnistysvuotta vuodessa, kaiken tiedon tallentaminen vie 400 000 petatavua, 400 eksabyyttiä, mikä on valtava määrä, jota emme voi edes tallentaa tällä hetkellä”, kertoo CERN: n tutkija Andreas Hoecker.

Ratkaisu suuren tietomäärän ongelmaan on tietysti niiden määrän dramaattinen vähentäminen. Ja tätä ei tehdä minkään tiedonpakkausalgoritmin kustannuksella, sillä tähän ei riitä kaikkien nykyisten supertietokoneiden prosessorien teho. CERNissä käytettävissä olevan tietotekniikan ominaisuudet sallivat vain 1200 törmäyksen tulosten tallentamisen jokaisesta 30 miljoonasta tapauksesta. Tämä on 0,004 prosenttia kokonaismäärästä, ja loput 99,996 prosenttia, kuten edellä mainittiin, menetetään ikuisesti.

Image
Image

Tämä tilanne näyttää kauhealta tuhlaukselta, mutta kaikki ei ole niin surullista. Ilmiöitä, jotka kiinnostavat tutkijoita todella, ei esiinny tällä vauhdilla. Esimerkiksi Higgs-bosoni ilmestyy nopeudella kerran sekunnissa, kun taas muita tapahtumia tapahtuu kymmenien tai satojen kertojen sekunnilla. Koko tietovirran mielenkiintoisimman korostamiseksi on mukana erityisiä "liipaisimia", laitteita, jotka suorittavat alustavaa tietojen suodatusta pääasiassa laitteistotasolla. Nämä liipaisimet kehitetään kullekin erityistapaukselle ja viritetään etsittyjen hiukkasten, kuten Higgs-bosonin, todellisen kvarkin, W- ja Z-bosonien, ominaisuuksien mukaisesti.

Mainosvideo:

Tietysti, kun tällainen alustava tietojenkäsittely toteutetaan, osa mielenkiintoisesta tiedosta menetetään yhdessä turhien ja mielenkiintoisten "roskien" kanssa. Mutta jäljellä oleva tieto sisältää pääosin merkittävää tietoa, ja sen suhteellisen vaatimaton volyymi mahdollistaa jo riittävän syvän prosessoinnin jopa reaaliajassa.

Ja lopuksi, on huomattava, että ratkaisu yllä kuvattuun ongelmaan ei missään nimessä takaa mahdollisuutta tallentaa enimmäkseen hyödytöntä tietoa. Ratkaisu ongelmaan on luoda törmäysaineelle uusia antureita, jotka käyttävät uusimman tekniikan viimeisimpiä saavutuksia ja jotka kykenevät tunkeutumaan tällä hetkellä tutkimatta olevan fysiikan alueiden syvyyksiin. Muuten, jotkut näistä antureista ilmestyvät törmäyslaitteeseen seuraavan nykyisen modernisoinnin yhteydessä. Ja modernisoidun törmäysaineiston on tarkoitus käynnistyä vuonna 2025.