4words by Sanmarco Informatica insegna a “parlare” ai motori di ricerca

I primi risultati di questo studio, uno dei pochi in corso in tutta Europa, sono stati presentati durante una conferenza al CNR di Roma. Importanti le potenzialità per l’ottimizzazione futura dei siti Internet

I motori di ricerca puntano a essere sempre più intelligenti: se fino a oggi si sono concentrati sulla pertinenza dei risultati rispetto alla ricerca dell’utente e sulla selezione delle pagine proposte, in futuro puntano addirittura a “leggere nel pensiero” dell’utente, arrivando a comprendere ciò che l’utente sta cercando anche se quest’ultimo non lo ha indicato esplicitamente, ad esempio perché non sa qual è il termine corretto per ciò che sta cercando, sia esso un oggetto o un procedimento di qualche tipo.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

È questo l’ambito della cosiddetta “ricerca semantica”, che rappresenta una delle principali frontiere degli studi sui futuri algoritmi dei motori di ricerca: non a caso Google già a partire dal 2013, con l’algoritmo Colibrì, ha introdotto proprio alcune funzioni incentrate sull’indicizzazione semantica, seppure in forma ancora superficiale, confermando così l’importanza sempre maggiore che avrà questa metodica.

LA RICERCA DI 4WORDS BY SANMARCO INFORMATICA

Tra le poche realtà italiane a poter vantare degli studi approfonditi in questo ambito vi è 4words, la business unit di Sanmarco Informatica Spa specializza in servizi e applicativi evoluti di marketing digitale, che ha presentato oggi i primi risultati della propria ricerca al CNR di Roma, in occasione di una conferenza organizzata da Senso Comune, un’associazione nazionale finalizzata allo studio della linguistica applicata agli strumenti informatici.

«I nostri studi su questo argomento – spiega Attilio Salvaro, direttore commerciale di 4words – sono iniziati oltre un anno fa, nella consapevolezza che fare ricerca su quelli che saranno gli algoritmi futuri dei motori di ricerca ci consentirà di realizzare per le aziende dei siti Internet più efficaci in termini di indicizzazione e quindi visibilità dei loro siti, un aspetto questo sempre più strategico, in particolare nell’ambito dei siti e-commerce, che costituiscono uno dei nostri ambiti di specializzazione. Si tratta di una ricerca tuttora in corso, ma dalla quale abbiamo ricavato una serie di conoscenze già immediatamente spendibili per la visibilità sul web».

Leggi anche:  Capisci Qlik - Talend, metti le mani in pasta!

I primi risultati sono stati appunto presentati in occasione della conferenza al CNR di Roma: « È stato già sviluppato – spiega Gabriele Fallica, il ricercatore di 4words responsabile del progetto – un prototipo funzionante che è in fase di progressivo ampliamento: già ora il computer, per la categoria tematica da cui abbiamo scelto di partire, è in grado trovare il termine corretto a partire da una ricerca per definizione, anche approssimativa. Di fatto, descrivendo la funzione di un oggetto, ovvero ciò che serve all’utente per le sue esigenze, il motore di ricerca capisce di quale oggetto si tratta restituendo così una risposta pertinente. Questo modello di organizzazione della conoscenza può essere ampliato fino a comprendere teoricamente l’intera semantica di una lingua e soprattutto può fornire una serie di indicazioni tecniche sui codici da inserire nelle pagine web per aiutare il motore di ricerca a capire di cosa stiamo parlando».

L’INDICIZZAZIONE SEMANTICA E L’EVOLUZIONE DEI MOTORI DI RICERCA

A spingere i motori di ricerca in questa direzione sono molteplici aspetti, in primis la complessità crescente delle ricerche degli utenti: diventando sempre più articolate, l’utilizzo di criteri semantici per la categorizzazione dei contenuti diventa un aiuto prezioso per arrivare a capire se una certa pagina web, al di là della mera presenza di un termine, è effettivamente rispondente alle aspettative dell’utente. I vantaggi, in prospettiva, sono infatti molteplici: non solo la possibilità di trovare ciò di cui ha bisogna anche se non sa esattamente quello che sta cercando (si pensi a quando si fanno ricerche specialistiche su ambiti di cui si ha una conoscenza ridotta), ma anche la possibilità in prospettiva di proporre all’utente associazioni (informazioni o prodotti) e informazioni complementari sempre più puntuali.

Leggi anche:  Bluesky, l’alternativa decentralizzata a X raggiunge i 2 milioni di utenti

Google punta infatti a diventare sempre più una vera intelligenza artificiale, in grado di riconoscere ciò che l’utente cerca: «Perché questo avvenga – spiega ancora Gabriele Fallica – bisogna che abbia a disposizione un insieme di informazioni semantiche già strutturare, una “ontologia” della conoscenza collegata a un certo argomento, prodotto o nome di azienda, organizzata in uno schema strutturato. Occorre quindi creare questa ontologia e metterla a disposizione di Google, ma per fare questo ho scelto di procedere al contrario: creare io stesso un rudimentale motore di ricerca, per costruire le mappe linguistiche, o per meglio dire l’ontologia, che il computer deve utilizzare per fornire delle risposte pertinenti. Questo è un procedimento a cui ci sottoponiamo in modo naturale da bambini, con il vantaggio che nell’apprendere il linguaggio oltre agli insegnamenti scolastici o dei genitori noi possiamo contare su una grande varietà di stimoli ed esperienze, cosa che il computer non può fare. Dobbiamo insegnargli tutto noi, creando dei modelli logici e matematici con cui rappresentare la conoscenza. Non solo, ma questo procedimento va fatto in modo tale che questa “mappa” possa poi essere incorporata nei siti Internet dei clienti e interpretata correttamente dai motori di ricerca. Il prototipo che abbiamo sviluppato serve appunto a questo scopo».

I VANTAGGI NELLO SVILUPPO DEI SITI INTERNET

I possibili benefici di questo ambito di studi sono molteplici e su vari livelli. «Nell’immediato – spiega Attilio Salvaro – vi è una migliore comprensione dei criteri di funzionamento dei motori di ricerca e della loro evoluzione, al punto che grazie a questa sperimentazione abbiamo messo a punto alcune tecniche che siamo già in grado di applicare sui siti web dei nostri clienti, in primis in quelli di e-commerce».

Leggi anche:  Musk sta per rendere open source il suo chatbot

Come detto, infatti, Google utilizza già i microdati per le ricerche semantiche, tanto è vero che le sue linee guida ufficiali li prevedono, ma per ora questa funzione è limitata alle informazioni su persone e prodotti e poco altro, mentre creare una vera ontologia semantica è qualcosa di più ampio e complesso.

I siti Internet possono inoltre utilizzare questa metodologia per dotarsi di nuove funzionalità “intelligenti”: si pensi alla possibilità, per un sito con centinaia di articoli a catalogo, di mettere a disposizione degli utenti un motore di ricerca interno in grado di indicare con precisione quale prodotto è il più adatto alle loro esigenze.

In prospettiva futura, inoltre, oltre ad una maggiore efficacia dell’indicizzazione e pertinenza delle risposte ricevute dagli utenti, un altro vantaggio importante potrebbe riguardare la stabilità: «Per la grande complessità di un’indicizzazione semantica – conclude Fallica – e il fatto che uno schema delle conoscenze di questo tipo è il più simile a quello utilizzato dalla mente umana, è probabile che un’indicizzazione semantica sia meno soggetta ai cambiamenti anche rapidi di algoritmo che abbiamo visto negli ultimi anni da parte di Google, con la necessità spesso di aggiornare profondamente i siti Internet e rifare la loro indicizzazione».