Finalul anului 2022 a fost marcat de lansarea instrumentului ChatGPT, un chat bazat pe inteligență artificială capabil să ofere răspunsuri la o mulțime de întrebări. Este de departe inovația momentului în acest sector de piață, așa că utilizatorii au început să exploateze potențialul major al acestui serviciu.
ChatGPT poate oferi răspunsuri la întrebări în limba română, poate scrie poezii și poate fi folosit pentru a crea texte ce pot fi folosite mai apoi în reclame, pe bloguri sau pe site-urile web. Așa că apare, în mod inevitabil, următoarea întrebare: este sigură utilizarea instrumentului ChatGPT pentru creare conținut și SEO? Acesta este subiectul articolului nostru, așa că poți afla răspunsul citind informațiile din rândurile următoare.
Cum funcționează ChatGPT
ChatGPT are la bază un sistem de învățare automată la scară largă. Folosindu-se de inteligența artificială, ChatGPT este un instrument ce utilizează cantitatea de date primită de la utilizatori ca pe un mod de antrenament.
Cu cât este instruit cu mai multe date despre mai multe tipuri de sarcini, cu atât va fi mai bun.
Acest lucru este similar cu modul de învățare al oamenilor. De exemplu, dacă un om învață elementele fundamentale ale tâmplăriei, el poate aplica acele cunoștințe pentru a construi o masă, chiar dacă acea persoană nu a fost niciodată învățată în mod specific cum să o facă.
GPT-3 funcționează similar precum un creier uman prin faptul că dispune de cunoștințe generale ce pot fi aplicate la mai multe sarcini.
ChatGPT încorporează un alt model de limbaj numit InstructGPT care a fost antrenat să ia indicații de la oameni și să ofere răspunsuri lungi chiar și la întrebări complexe.
Această capacitate de a urma instrucțiunile face ChatGPT să poată primi instrucțiuni pentru a crea un eseu pe aproape orice subiect. Poate scrie un eseu în limitele constrângerilor precum numărul de cuvinte și includerea unor puncte specifice subiectului.
6 lucruri pe care trebuie să le știi despre ChatGPT
ChatGPT poate scrie eseuri pe aproape orice subiect, deoarece este instruit pe o mare varietate de text care este disponibil publicului larg.
Există totuși limitări important de cunoscut înainte de a decide să folosești ChatGPT într-un proiect SEO.
Cea mai mare limitare este că ChatGPT nu este de încredere pentru a genera informații exacte. Motivul pentru care este inexact este faptul că modelul prezice doar ce cuvinte ar trebui să apară după cuvântul anterior într-o propoziție dintr-un paragraf pe un anumit subiect. Nu este preocupat de acuratețe.
Aceasta ar trebui să fie o preocupare de top pentru oricine este interesat să creeze conținut de calitate.
1. Programat pentru a evita anumite tipuri de conținut
De exemplu, ChatGPT este programat special pentru a nu genera text pe subiecte de violență explicită, sex explicit și conținut dăunător, cum ar fi instrucțiunile despre cum poți construi un dispozitiv exploziv.
2. Nu este la curent cu evenimentele curente
O altă limitare este că ChatGPT nu este, cel puțin momentan, la curent cu conținutul creat după 2021. Asta înseamnă că dacă ai nevoie de conținut actualizat, atunci ChatGPT nu reprezintă neapărat o soluție.
3. Are prejudecăți încorporate
O limitare importantă de care trebuie să fii conștient este că acest instrument a fost antrenat să fie util, sincer și inofensiv. Acestea nu sunt doar idealuri, sunt prejudecăți intenționate ce au fost încorporate în acest ChatGPT.
Se pare că programarea inofensivă face ca rezultatul să evite negativitatea. Este un lucru bun, dar schimbă subtil articolul dintr-unul care ar putea fi ideal în unul neutru.
De exemplu, dacă vei cere ca ChatGPT să scrie o poveste în stilul unui autor cunoscut pentru stilul său negativ, este foarte probabil să primești o povestire cu final optimist, ceea ce este oarecum greșit.
Pentru a evita finalurile optimiste, va trebui să oferi instrucțiuni detaliate. Ideea este că ChatGPT are părtiniri și trebuie să fii conștient de modul în care ar putea fi influențat rezultatul.
4. ChatGPT necesită instrucțiuni foarte detaliate
ChatGPT necesită instrucțiuni detaliate pentru a oferi conținut de calitate superioară, care are șanse mai mari de a fi original. Cu cât i se oferă mai multe instrucțiuni, cu atât rezultatul va fi mai sofisticat.
Aceasta este atât un avantaj cât și o limitare de care trebuie să fii conștient.
Cu cât există mai puține instrucțiuni în cererea de conținut, cu atât este mai probabil ca rezultatul să partajeze un text similar cu cel oferit la o altă solicitare.
ChatGPT este conceput pentru a alege cuvinte complet aleatorii atunci când prezice care ar trebui să fie următorul cuvânt dintr-un articol așa că are sens să nu se autoplagieze.
5. Poate fi identificat conținutul ChatGPT?
Cercetătorii de la Google și alte organizații lucrează de mulți ani la algoritmi pentru detectarea cu succes a conținutului generat de inteligența artificială.
Există multe lucrări de cercetare pe această temă și vom vorbi despre una din martie 2022, care a folosit rezultate de la GPT-2 și GPT-3.
Lucrarea de cercetare se intitulează „Robustitatea adversară a caracteristicilor neuronale-statistice în detectarea transformatoarelor generative (PDF)”.
Cercetătorii testau pentru a vedea ce fel de analiză ar putea detecta conținutul generat de inteligența artificială care folosea algoritmi concepuți să evite detectarea.
Ei au testat strategii precum folosirea algoritmilor BERT pentru a înlocui cuvintele cu sinonime, un altul care a adăugat greșeli de ortografie, printre alte strategii.
Ceea ce au descoperit este că unele caracteristici ale textului generat de inteligență artificială, cum ar fi indexul Gunning-Fog și scorurile indicelui Flesch, au fost utile pentru a prezice dacă un text a fost generat de un computer, chiar dacă acel text a folosit un algoritm conceput pentru a evita detectarea.
6. Watermarking invizibil
Mai interesant este faptul că cercetătorii OpenAI au dezvoltat un watermark criptografic care va ajuta la detectarea conținutului creat printr-un produs OpenAI precum ChatGPT.
Un articol recent a atras atenția asupra unei discuții a unui cercetător OpenAI, care este disponibilă într-un videoclip intitulat Scott Aaronson Talks AI Safety.
Scott Aaronson afirmă că practicile etice de inteligență artificială, cum ar fi watermark, pot evolua pentru a deveni un standard al industriei, așa cum Robots.txt a devenit un standard pentru crawling etic.
El a declarat:
… am văzut în ultimii 30 de ani că marile companii de internet pot conveni asupra anumitor standarde minime, fie din cauza fricii de a fi date în judecată, fie din cauza dorinței de a fi văzute ca un jucător responsabil sau de orice altceva.
Un exemplu simplu ar fi robots.txt: dacă doriți ca site-ul dvs. să nu fie indexat de motoarele de căutare, puteți specifica acest lucru, iar motoarele de căutare majore îl vor respecta.
Într-un mod similar, v-ați putea imagina ceva de genul watermarking – dacă am fi capabili să demonstrăm și să arătăm că funcționează și că este ieftin și nu dăunează calității rezultatelor și nu necesită mult calcul și așa mai departe – asta ar deveni doar un standard al industriei și oricine dorea să fie considerat un jucător responsabil l-ar include.
Scott Aaronson
Watermarkul pe care l-a dezvoltat cercetătorul se bazează pe o criptografie. Oricine are cheia poate testa un document pentru a vedea dacă are watermarkul digital care arată că este generat de un AI.
Codul poate fi sub forma modului în care este utilizată punctuația sau în alegerea cuvintelor, de exemplu.
El a explicat cum funcționează acest watermark și de ce este important:
Proiectul meu principal de până acum a fost un instrument de marcare statistică a rezultatelor unui model text precum GPT.
Practic, ori de câte ori GPT generează un text lung, dorim să existe un semnal secret, altfel neobservat, în alegerile sale de cuvinte, pe care îl puteți folosi pentru a demonstra mai târziu că, da, acesta a venit de la GPT.
Vrem să fie mult mai greu să luați un text de la GPT și să-l transmiteți ca și cum ar proveni de la un om.
Acest lucru ar putea fi util pentru prevenirea plagiatului academic, evident, dar și, de exemplu, pentru generarea în masă a propagandei – știți, spamând fiecare blog cu comentarii aparent la subiect care susțin invazia Rusiei în Ucraina, fără măcar o clădire plină de troli la Moscova.
Sau uzurparea identității stilului de scriere al cuiva pentru a-l incrimina.
Acestea sunt toate lucrurile pe care ar trebui să le îngreunăm, nu?
Scott Aaronson
Cercetătorul a spus că procesul de watermarking înfrânge eforturile algoritmice de a evita detectarea.
Ar trebui să utilizezi AI în scopuri SEO?
Conținutul SEO este detectabil?
Mulți oameni spun că Google nu poate ști dacă conținutul a fost generat folosind AI.
Este greu de înțeles de ce cineva ar avea acea părere, deoarece detectarea AI este o problemă care a fost mai mult sau mai puțin deja rezolvată.
Chiar și conținutul care implementează algoritmi anti-detecție poate fi detectat.
Detectarea conținutului generat de roboți a fost un subiect de cercetare cu mulți ani în urmă, realizându-se inclusiv cercetări privind modul de detectare a conținutului care a fost tradus dintr-o altă limbă.
Conținutul generat automat încalcă regulile Google?
John Mueller de la Google a declarat în aprilie 2022 că conținutul generat de AI încalcă regulile Google.
Pentru noi, acestea ar intra, în esență, în categoria conținutului generat automat, ceea ce am avut în Ghidul pentru webmasteri încă de la început.
Și oamenii au generat automat conținut în multe moduri diferite. Și pentru noi, dacă utilizați instrumente de învățare automată pentru a vă genera conținutul, este în esență același lucru ca și cum ați amesteca cuvinte, sau căutați sinonime sau faceți trucurile de traducere pe care le făceau oamenii. Genul ăsta de lucruri.
Bănuiala mea este că poate calitatea conținutului este puțin mai bună decât instrumentele vechi, dar pentru noi este încă conținut generat automat și asta înseamnă că pentru noi este încă împotriva Regulilor pentru webmasteri. Așa că am considera că este spam.
John Mueller
Google a actualizat recent secțiunea de conținut „generat automat” a paginii pentru dezvoltatori despre spam.
Creat în octombrie 2022, regulamentul a fost actualizat aproape de sfârșitul lunii noiembrie 2022.
Modificările reflectă o clarificare cu privire la ceea ce face ca conținutul generat automat să fie spam.
Conținutul generat automat este conținut care a fost generat programatic fără a produce nimic original sau a adăuga valoare suficientă.
Google a actualizat acea propoziție pentru a include cuvântul „spam”.
Această modificare pare să clarifice faptul că pur și simplu conținut generat automat nu îl face să fie spam. Lipsa tuturor valorilor adăugate și a calităților generale „spam” face ca acel conținut să fie problematic.
ChatGPT poate conține la un moment dat un watermark
În cele din urmă, cercetătorul OpenAI a spus (cu câteva săptămâni înainte de lansarea ChatGPT) că „sperăm” să apară opțiunea de a include un watermark în următoarea versiune de GPT.
Așadar, ChatGPT poate fi actualizat la un moment dat cu watermark, dacă nu este deja marcat.
Cea mai bună utilizare a inteligenței artificiale pentru SEO
Cea mai bună utilizare a instrumentelor AI este pentru scalarea SEO într-un mod care să facă munca mai productivă. Aceasta constă de obicei în a lăsa AI să facă munca obositoare de cercetare și analiză.
Rezumarea paginilor web pentru a crea o meta-descriere ar putea fi o utilizare acceptabilă, deoarece Google spune în mod special că nu contravine regulilor sale.
Utilizarea ChatGPT pentru a genera o schiță sau un rezumat de conținut ar putea fi o utilizare interesantă.
Predarea creării de conținut către un instrument AI și publicarea lui așa cum este ar putea să nu fie cea mai eficientă utilizare a AI dacă nu este mai întâi revizuită pentru calitate, acuratețe și utilitate.