Vocea întregului sector de
upstream din România

Era sistemelor cognitive: Inteligență Artificială + Big Data

Într-un articol recent, pe lângă introducerea a două noi concepte: roci digitale și fracturarea hidraulică 2.0, am menționat și existența unei perechi de termeni: inteligență artificială și Big Data. Prezentarea fiind succintă, nu am explorat în profunzime o serie de proprietăți și capacități sinergetice ale celor doi termeni. Dar împreună, ei reprezintă un binom, care definește, pe scurt, un sistem cognitiv.

Pentru a da o definiție mai cuprinzătoare și a exemplifica un sistem cognitiv, să ne amintim că, la începuturi, în jurul anilor 1950, computerul era, esențial, un „mare idiot”: nu știa decât două numere, 0 și 1, cu care însă efectua calcule mai multe și mai rapide decât cel mai genial om. Și în plus, ceea ce era, și încă este important, acele calcule erau precise. Dar erau acele rezultate și acurate?[1]

Aici intervine marea deosebire dintre limbajul folosit de computere în prezent și limbajul natural (uman).

Limbajul nostru este plin de aluzii, insinuări, ambiguități, idiosincrazii și expresii idiomatice. Cu toate acestea, noi putem transmite foarte mult înțeles și realiza o intensă colaborare, chiar în cele mai dificile situații, datorită limbajului. Cumva, noi reușim să pricepem ceea ce comunicăm, chiar dacă apar omisiuni, inconsecvențe, neregularități, neclarități iar, în final, putem să ne înțelegem unii pe alții cu acuratețe.

Pentru un computer, „2+2” va însemna întotdeauna 4 (ceea ce înseamnă precizie). Dar noi putem considera că „2+2” nu este o formulă matematică, ci mai degrabă o expresie idiomatică pentru configurația locurilor dintr-o mașină (două locuri în față, două locuri în spate). Sau modul în care un psiholog vrea să se refere la o familie cu 2 părinți și 2 copii. În aceste contexte, răspunsul „4” este precis, dar nu este o interpretare acurată aceea ce încercăm noi să spunem prin limbaj. Pentru a răspunde cu acuratețe unei întrebări, trebuie să considerăm contextul întrebării. Fără suficiente informații suplimentare, este greu de răspuns cu acuratețe unei întrebări – chiar dacă literalmente se poate răspunde cu precizie elementelor din întrebare.

Dacă vrem ca computerul nostru să răspundă și cu precizie și cu acuratețe la întrebări, ne trebuie o interfață om-computer prin care să putem interacționa. Ea se numește Procesarea Limbajului Natural (PLN). Și aici apare primul dintre cele două elemente ale binomului menționat, Inteligența Artificială, cea care, prin metodele dezvoltate și prezentate deja, asigură crearea unei lingvistici computaționale.

La un nivel superficial, PLN se găsește deja instalat în produse curente de pe piață. De exemplu, folosind GPS-ul din mașină sau un alt dispozitiv, activat prin voce, puteți comanda: „Găsește-mi o florărie!” Ceea ce veți obține va fi o listă cu florăriile locale – în fond, asta ați dorit. Dacă însă comandați „Nu-mi găsi o florărie!”, veți obține aceeași listă – ori nu asta ați dorit acum. Cereți acum „Găsește-mi o florărie ieftină!” sau ”O florărie deschisă la ora 22”, și listele oferite vor fi identice cu prima. Ideea este că aceste sisteme sunt proiectate pentru un set de reguli specifice – caută un cuvânt-cheie (ori combinații de cuvinte-cheie) ca să decidă răspunsul. Sistemele nu știu cum să distingă între lucruri pentru care nu există reguli. Adică, aceste sisteme, folosind un nivel superficial PLN, sunt precise, dau nu au acuratețe.

Pentru a depăși limitările descrise, un nivel adânc PLN incorporează mult mai mult context în evaluarea unei întrebări în vederea obținerii unei acuratețe maxime. Pe lângă context, un sistem cu nivel adânc PLN va folosi și o bază de cunoștințe (corpus) din care își va extrage informațiile necesare pentru a răspunde unei întrebări.

Folosind acum o definiție mai cuprinzătoare, sistemele cognitive sunt o categorie de tehnologii care utilizează procesarea limbajului natural (de nivel adânc), împreună cu procese de data mining și machine learning, pentru a interacționa mai natural și a amplifica cunoașterea și expertiza umana. Aceste sisteme vor auto-învăța și interacționa ca să ofere asistență expertă oamenilor de știință, inginerilor, doctorilor, finanțiștilor, avocaților și altor categorii profesionale într-o fracțiune din timpul necesar în prezent.

O descriere a principalelor tipuri de învățare (supravegheată, nesupravegheată, semi-supravegheată, activă) și a algoritmilor prin care computerul învață (rețele neuronale artificiale, mașini cu suport vectorial, arbori decizionali, clasificatori Bayes naivi) se găsesc în capitolul introductiv al cărții „Artificial Intelligent Approaches in Petroleum Geosciences” și în articolele mele listate în Bibliografie.

Dacă sistemele de calcul primitive, folosite în SUA mai ales pentru recensăminte, au inaugurat era sistemelor tabulare cu circa 110 ani în urmă, începutul anilor 1950 a marcat debutul erei sistemelor programabile, cu rânduri și coloane de date, manipulate prin programe ca Java sau C++, aflate și în prezent la datorie.

Era sistemelor cognitive (2011 – ?)

Pentru a naviga cu eficiență prin oceanul actual de informații structurate și nestructurate este necesară o schimbare de paradigmă, pe care doamna Ginny Rommety, CEO IBM, a numit-o era sistemelor cognitive.

Anul 2011 a însemnat „nașterea” lui Watson – primul sistem cognitiv produs de IBM- (alte sisteme au apărut mai recent[2]).

Demonstrația publică a lui Watson a fost spectaculoasă: în 2011, el a concurat în direct cu doi campioni în cadrul unei emisiuni-concurs, de tip „Cine știe, câștigă!”, foarte populară în Statele Unite[3]. Primul sistem cognitiv din lume a avut acces, în timpul emisiunii, la 200 milioane de pagini de conținut structurat și nestructurat, incluzând textul complet al enciclopediei Wikipedia. Datele au fost stocate pe 4 Tb de memorie internă. Învingându-i fără drept de apel pe cei doi campioni, Watson a câștigat un premiu de $1.000.000 dolari și dreptul de a inaugura noua eră a viitorului computațional.

My name is Watson! What is your name? (Sursa)

Amintesc și faptul că IBM Deep Blue, un frate mai mare al lui Watson, a fost primul computer din istorie care l-a învins pe un campion mondial la șah în 1997, anulând prejudecata conform căreia „nu s-a creat încă un computer care să câștige la sah în fața unui mare maestru”. În plan Science-Fiction, primul sistem cognitiv a fost prezentat în filmul-cult Odiseea spațială 2001, realizat de Stanley Kubrick în 1968: este vorba despre celebrul computer-vorbitor HAL 9000. (Pentru o perspectivă temporală, în 1968, Bill Gates și Steve Jobs aveau 13 ani.)

După debutul public spectaculos al lui Watson, compania IBM a organizat (în perioada 2011-2013) o divizie internă de startup menită să valideze sistemul cognitiv. Iar în 2014 a început faza de comercializare a sistemului prin crearea Grupului IBM Watson. Până în prezent, IBM a investit un miliard dolari în această afacere, în care sunt folosiți mii de programatori din lumea întreagă pentru a scrie codurile de calcul și a testa/valida sistemul cognitiv.

Sistemul cognitiv Watson și industria hidrocarburilor

Tot în anul 2014, IBM a înființat Grupul Chemicals & Petroleum, care s-a implicat cu mare succes în implementarea noii tehnologii computaționale în activitățile din industria de petrol și gaze, convenționale și neconvenționale.

Succesul lui Watson în tehnologiile folosite de industria hidrocarburilor se datorează unor calități pe care sistemul cognitiv le-a demonstrat:

  1. Watson înțelege limbajul natural și comunicarea în stil uman. El poate înțelege atât intenția persoanei care întreabă, cât și contextul în care întrebarea a fost pusă. Răspunsul lui este bazat pe relevanța și rațiunea faptelor invocate. Mai mult, logica răspunsului ales este expusă persoanei care întreabă, fiind subiectul unei foarte intense aprecieri bazate pe dovezi irefutabile. Watson poate comunica aproape ca un om, răspunzând la întrebări diverse: „Watson, de ce ratele de producție ale zăcământului X s-au schimbat față de anul trecut?”, „Watson, s-a înțepenit prăjina în gaura de sondă. Ce trebuie să fac acum?”.
  2. Watson generează și evaluează ipoteze bazate pe dovezi. Prin această calitate, Watson este mult mai dezvoltat decât asistenții digitali de pe telefoanele noastre inteligente (vezi exemplele de mai sus).
  3. Watson se adaptează și învață din trening, interacțiuni și rezultate deja obținute. Practic, Watson învață și se adaptează cu fiecare nouă sursă de date pe care noi o introducem în corpus –ul său (de ex., date de producție, jurnale de întreținere a echipamentului, analiza accidentelor produse, grafice ale timpilor ne-productivi etc.). Toate aceste adăugiri de date conduc la creșterea calității raționamentelor și a acurateței recomandărilor. Pentru Watson, învățarea este continuă!

Apariția lui Watson a marcat și o nouă evoluție informațională: de la stadiul analitic („Fă lucrurile corect!”) s-a ajuns la stadiul cognitiv (”Fă lucrurile corecte!”). O schemă ilustrând această evoluție cuprinde următorii pași:

- Ce s-a întâmplat? (analiză descriptivă)

- Ce se va întâmpla? (analiză predictivă)

- Ce trebuie să facem acum? (analiză predictivă directă)

- Cum putem învăța din acestea și cum putem îmbunătăți activitatea noastră? (analiză cognitivă)

Aplicarea acestei scheme unei probleme comune din industrie (d. ex., „O cerere de forare a unei noi sonde”), necesită parcurgerea mai multor pași și, pentru fiecare din ei, sunt necesare multe date specializate pentru a oferi o soluție (un răspuns). Soluțiile cognitive, oferite de Watson, nu sunt menite să înlocuiască pe cele analitice, ci să le complementeze, în vederea luării deciziei optime de forare (locație, tip de foraj, detalii de design, drepturi de acces, plan de execuție etc.).

Similar, Watson este extrem de eficient și în găsirea de soluții pentru creșterea eficienței rafinăriilor și uzinelor petrochimice sau pentru optimizarea operațiunilor globale ale unei companii transnaționale.

Câteva date despre Big Data și soluțiile cognitive din industria hidrocarburilor

Al doilea membru al binomului definit la începutul articolului este Big Data, o realitate a perioadei actuale, produsă de introducerea fracturării hidraulice și a forajului orizontal.

În industria hidrocarburilor, Big Data sunt caracterizate de cei patru V:

- Volum: Se estimează că o singură platformă de foraj conține astăzi până la 40,000 de senzori, care produc circa 2 Terabytes de date pe zi! Dacă considerăm numărul total de instalații de foraj din SUA și timpul lor de acțiune, cantitate de date disponibile în industrie este impresionantă – de ordinul Zettabytes (1021 bytes)!

- Varietate: Mai trebuie adăugat că senzorii nu sunt singurele surse de date din industrie: multe altele vin din carotaje, rapoarte de producție, jurnale de mentenanță, diverse rapoarte și studii. Dintre acestea, 80% sunt date nestructurate, care necesită o pre-procesare pentru a putea fi corect folosite de computere.

 

- Viteză: Big Data merg mână în mână cu Fast Data (date cu mare viteză). Volumul de date create de industria hidrocarburilor crește mereu și consumatorii acestor date – operatori și analiști – caută să le obțină în cel mai scurt timp posibil. Procesarea de tip Hadoop batch și transmiterea ultra-rapidă de tip streaming au trezit interesul pentru Big Data. În principiu, oamenii nu numai că vor toate datele, ei le vor cât mai repede posibil – aceasta produce trendul către Fast Data. Datele de mare viteză pot însemna milioane de rânduri pe secundă, scopul lor principal fiind analizele și soluțiile cognitive în timpi reali. Sistemele cognitive reduc cantitatea de transmisii din și în cloud. Asta înseamnă economie de energie, creșterea performanței și a caracterului privat al operațiunilor.

 

- Veridicitate: Când există dubii despre calitatea unor date, trebuie luate măsuri suplimentare de verificare a veridicității lor. Marea provocarea pe care o reprezintă corecta interpretare a datelor existente se reflectă, între altele, și în costurile exorbitante pe care industria le suferă în cazurile de plasare greșită a unui foraj: costuri directe în valoare de $150 milioane, și costuri de oportunitate de circa $1 miliard pe an.

Sistemele cognitive au început să reprezinte noua frontieră a cunoașterii și în domeniul roboticii: mașini complet automate, semi-automate sau drone pot opera și executa operații în medii periculoase sau îndepărtate. Dacă ne oprim numai la domeniul hidrocarburilor, merită apreciați roboții care acționează pe platformele marine, pe fundul oceanelor, în zonele arctice/antarctice ș.a., înlocuind personalul uman și mărind astfel coeficientul HSE (sănătate, siguranță, protecția mediului).

Procesarea imaginilor digitale au permis lui Watson să ofere soluții, la început, medicilor oncologi (depistare, diagnoză, tratament), iar mai târziu, și geologilor (structura și conținutul în fluide ale porilor rocilor, atribute seismice etc.).

Înțelegerea limbajului natural, cuplat cu înțelegerea textului în alte limbi, îi permit lui Watson să poarte dialoguri cu utilizatorii din industria hidrocarburilor pentru

  1. identificarea/caracterizarea noilor arii de interes;
  2. evaluarea perimetrelor de interes din cadrul ariilor;
  3. evaluarea perimetrelor ce urmează a fi cumpărate.

Dialogul natural om-mașină creează un avantaj competitiv clar: exploatează cunoștințele colective ale companiilor și toate datele interne și externe disponibile pentru a lua decizii inteligente – mai rapide, mai calificate și mai documentate. Folosirea sistemelor cognitive reprezintă, astfel, o pârghie eficientă pentru mărirea productivității.

Revoluția fracturării hidraulice, faza 2.0, se regăsește în, și beneficiază din plin de era sistemelor cognitive.

Călătoria continuă!…

______________________

BIBLOGRAFIE

Cranganu, C., H. Luchian and M. E. Breaban (Eds), 2015, Artificial Intelligent Approaches in Petroleum Geosciences, Springer, ISBN: 978-3-319-16530-1, 290 p.

Cranganu, C., 2015, Fracturarea hidraulică 2.0: Roci digitale, inteligență artificială, big data și soft computing.

Bahrpeyma, F., B. Golchin, and C. Cranganu, 2013, Fast fuzzy modeling method to estimate missing logs in hydrocarbon reservoirs, J. Pet. Sci. and Eng., v. 112, p. 310 – 321.

Cranganu, C., and Breaban, M., 2013, Using support vector regression to estimate sonic log distributions: A case study from the Anadarko Basin, Oklahoma, J. Pet. Sci. and Eng., v. 103, p. 1 -13.

Cranganu, C., and E. Bautu, 2010, Using gene expression programming to estimate sonic log distributions based on the natural gamma ray and deep resistivity logs: A case study from the Anadarko Basin, Oklahoma, Journal of Petroleum Science and Engineering, v. 70, p. 243 – 255 (articol nominalizat pentru ENI Awards 2012)

Cranganu, C., 2007, Using artificial neural networks to predict the presence of overpressured zones in the Anadarko Basin, Oklahoma, Pure and Applied Geophysics, v. 164, p. 2067 – 2081.

IBM Software Group, IBM Watson Solutions, 2012, The Era of Cognitive Systems. An inside look at IBM Watson and how it works, 19 p.

Simovici, D., 2015, Intelligent Data Analysis Techniques – Machine Learning and Data Maining, in Cranganu et al. (Eds.), Artificial Intelligent Approaches in Petroleum Geosciences, Springer, ISBN: 978-3-319-16530-1, p.1 – 51.

NOTE___________________


[1] Diferența între precizie și acuratețe este importantă. În contextul articolului de față, precizia reprezintă exactitatea mecanică sau științifică de a găsi ceva într-un pasaj al unui text. De exemplu, putem determina dacă un cuvânt specific există într-un pasaj cu un mare grad de precizie. Acuratețea reprezintă gradul de apropiere de realitate a unui pasaj dedus din alt pasaj.

[2] Alte două exemple, ulterioare lui Watson, sunt proiectul DeepMind (2014) al lui Google și platforma Zeroth (2015), produsă de Qualcomm.

[3] Numit așa în cinstea lui Thomas J. Watson, primul CEO al lui IBM.

 

Articol publicat pe CONTRIBUTORS si republicat cu permisiunea autorului. 

Constantin Crânganu este profesor de geofizică și geologia petrolului la Graduate Center și Brooklyn College, The City University of New York. Între 1980 și 1993 a fost asistent și lector la Universitatea „Al. I. Cuza” din Iași, Facultatea de geografie-geologie. În 1993 a fost declarat câștigătorul primului concurs național din România post-comunistă pentru prestigioasa bursă Fulbright oferită de Congresul SUA. În calitate de Fulbright Visiting Scientist la University of Oklahoma el a efectuat cercetări fundamentale și aplicative despre zăcămintele de petrol și gaze, suprapresiunile din bazinele sedimentare, fluxul termic și căldura radioactivă din crusta terestră, identificarea stratelor cu conținut de gaze în gaura de sondă, exploatarea printr-o metodă personală a zăcămintelor neconvenționale de hidrați gazoși etc. După mutarea în 2001 la City University of New York, profesorul Crânganu a început o nouă direcție de cercetare: implementarea metodelor de inteligență artificială în studiile de petrol și gaze. Pentru activitatea sa în acest domeniu de pionierat a fost nominalizat la ENI Awards 2012 și a primit o ofertă din partea editurii Springer de a publica o carte reprezentativa pentru acest domeniu cutting-edge.

Cartea, intitulata „Artificial Intelligent Approaches in Petroleum Geosciences”, a aparut în 2015.

STIRI INTERNATIONALE

Norway: Equinor...

The Norwegian Petroleum Directorate has granted Equinor a drilling permit for well 36/1-3 in production licence PL 885. The well will be drilled...

Angola: Eni announces...

Eni has started production from the Vandumbu field in Block 15/06 through the West Hub N’Goma FPSO. First oil from the Vandumbu field was achieved...

Canada-Nova Scotia...

The Canada-Nova Scotia Offshore Petroleum Board (CNSOPB) has issued Call for Bids NS18-3, which includes two industry-nominated parcels. The Call...
STIRI LOCALE

ANRE: Profit de 10%...

Companiile care dețin și operează depozite de înmagazinare a gazelor naturale în România vor fi...

Până pe 28 ian,...

Realizarea conductei de transport gaze naturale dintre Onești-Gherăești-Lețcani a fost scoasă la...

România a înregistrat...

Produsul Intern Brut a crescut cu 0,2% în zona euro şi cu 0,3% în Uniunea Europeană în...
COTATII OIL & GAS