Prepara les teves dades per a la IA: la feina poc glamurosa que ho decideix tot

Hi ha una veritat silenciosa darrere de gairebé tot projecte d’IA que decep: el model estava bé. La demo funcionava. El que es va trencar van ser les dades — incompletes, repartides entre sistemes que no es parlen, plenes d’inconsistències que ningú no havia notat fins que una màquina va començar a llegir-les al peu de la lletra.

La IA no arregla les dades desordenades. Les exposa, a escala i amb seguretat. Un assistent recolzat en una fitxa de client a mitges donarà respostes a mitges amb un to convincent — cosa que és pitjor que no donar resposta. Així que abans de la part emocionant hi ha una feina poc glamurosa: deixar les teves dades en un estat en què la IA les pugui fer servir amb confiança. Aquesta és aquesta feina, i com fer el 20 % útil sense un programa de dades d’un any.

Per què el coll d’ampolla són les dades, no el model

Els models són extraordinaris i milloren cada pocs mesos — i són una mercaderia. Tu i la teva competència podeu trucar al mateix. El que tu tens i ells no són les teves dades: els teus clients, les teves comandes, el teu historial, els teus documents. Aquest és el fossat, i també la restricció. El sostre del que la IA pot fer pel teu negoci el marca el que les teves dades li poden explicar.

Dit d’una altra manera: un model brillant amb dades dolentes és un mentider convincent. Un model modest amb dades netes i accessibles és un company útil. Gairebé qualsevol negoci trauria més valor de millorar el segon factor que de perseguir el primer.

Les cinc coses que vol dir de debò estar “a punt”

“Preparar les dades” sona a megaprojecte. No ho és — són cinc propietats concretes, i només les necessites per a les dades que la IA farà servir de debò.

1. Accessibles. Pot un sistema arribar a les dades, via API o base de dades — o viuen només en un PDF, un full de càlcul d’escriptori o el correu d’algú? La IA no pot fer servir el que no pot abastar. Sol ser el primer bloqueig real, i per això connectar les teves eines amb APIs i protocols com MCP sovint és el pas zero.

2. Exactes. Reflecteixen les dades la realitat? Preus caducats, clients duplicats, contactes que se’n van anar fa dos anys. Les persones ho esquiven en silenci cada dia (“ah, ignora aquesta fitxa”). La IA no sap que ho ha de fer.

3. Consistents. “Acme SL”, “Acme Limited” i “ACME” són la mateixa empresa per als teus sistemes, o tres? S’escriuen les dates, monedes i unitats igual a tot arreu? La inconsistència és invisible per a les persones i catastròfica per a les màquines.

4. Prou completes. No perfectes — prou per a la tasca. Un predictor de baixes necessita l’historial d’ús; un assistent de suport necessita els teus articles d’ajuda reals. Sàpigues quins camps importen per a la tasca i assegura’t que estan plens.

5. Governades. Qui pot veure què? Un assistent d’IA que ho pot llegir tot ensenyarà encantat un sou o un contracte confidencial a qui pregunti. Els permisos i un registre bàsic de quines dades es fan servir on no són burocràcia — són el que fa que la IA sigui segura de desplegar.

L’avaluació honesta: on són les teves dades ara mateix?

Abans de qualsevol projecte, fes una auditoria d’una pàgina de les dades que tocarà. Per a cada font, respon quatre preguntes:

On viuen, i pot un sistema arribar-hi de manera programàtica?
Com de netes estan, a grans trets — impecables, usables o un pantà conegut?
Qui n’és l’amo, i qui les pot fer servir?
Estan estructurades (camps de base de dades) o no estructurades (PDFs, correus, documents escanejats)?

Gairebé sempre trobaràs el mateix patró: les dades existeixen, però estan atrapades, són inconsistents o estan repartides entre eines que mai no es van pensar per compartir. És normal. La feina de l’auditoria no és deprimir-te — és convertir un vague “les nostres dades són un desastre” en una llista curta i arreglable.

Estructurades vs no estructurades — i per què importa ara

Durant anys, el munt no estructurat — contractes, correus, factures escanejades, notes de reunió — era, a la pràctica, dades a les fosques. Massa car de llegir, així que es quedava sense fer servir.

Aquesta equació ha canviat. La IA moderna llegeix documents no estructurats prou bé com per treure els fets estructurats amagats a dins — que és justament la premissa d’automatitzar la feina amb molta paperassa. La conseqüència pràctica: dades que havies donat per inservibles poden ser ara la teva font més rica. No les descartis per inèrcia. Alguns dels millors projectes d’IA comencen encenent el llum en aquell munt a les fosques.

Comença petit: l’enfocament de la llesca fina

El moviment equivocat és un “programa de transformació de dades” — divuit mesos, un pressupost de sis xifres, un data lake que ningú no va demanar. Quan aterra, el negoci ha canviat i s’han acabat les ganes.

El moviment correcte és una llesca fina. Tria un cas d’ús valuós — respondre preguntes de suport des de la nostra documentació, marcar factures que no quadren amb comandes, predir quines proves es convertiran — i deixa en forma només les dades que aquest cas necessita. Neteja aquelles tres fonts, no les trenta. Llança-ho. El resultat funcionant es guanya el pressupost i la paciència per a la llesca següent, i aprens què vol dir de debò “a punt” per al teu negoci fent-ho un cop, barat.

Això reflecteix com abordem l’automatització en general: demostra valor en una cosa petita i real, i després amplia. Un data lake entrega valor el dia que s’acaba; una llesca fina entrega valor a la setmana tres i paga la resta.

Una checklist mínima de preparació de dades

Per al cas d’ús concret que tens al cap, estàs a punt per construir quan:

Les dades que la IA necessita són abastables per un sistema (API/base de dades), no tancades en arxius.
Les fitxes clau estan desduplicades i són raonablement exactes.
Noms, dates, monedes i identificadors són consistents entre les fonts rellevants.
Els camps de què depèn la tasca estan plens.
Saps qui pot veure què, i la IA respecta aquests permisos.
Hi ha una persona que és l’ama de cada font de dades i pot respondre preguntes sobre ella.

Si tens la majoria marcades per al teu únic cas d’ús, construeix. Si no, aquesta mancança és el primer projecte — i és un punt de partida més barat i de menys risc que la mateixa IA.

Preguntes freqüents

Necessitem un data warehouse o un data lake abans de poder fer servir IA? En general no — i tractar-ho com a requisit previ és com els projectes d’IA es retarden un any. La majoria de casos d’ús d’una pime necessiten un grapat de fonts connectades i netes, no una plataforma central. Construeix el warehouse després, si diversos projectes ho justifiquen.

Com de netes han d’estar les dades de debò? Prou per a la tasca concreta, ni més. Un assistent de cara al client té un llistó alt perquè els errors són públics; un generador intern d’esborranys tolera més soroll perquè una persona revisa la sortida. Ajusta l’esforç al que hi ha en joc.

Les nostres dades estan repartides per moltes eines. És un impediment? No — és el punt de partida normal. La feina és connectar les rellevants, cosa que és un projecte d’integracions, sovint amb APIs o MCP. No necessites tot en un lloc; necessites que la IA pugui abastar les coses correctes.

No és això només una manera de vendre’ns un projecte més gran? Al contrari. La feina honesta de preparar dades sol fer el projecte d’IA més petit i amb més probabilitats d’èxit, perquè no construeixes sobre sorra. Preferim dimensionar una llesca fina que funcioni abans que un gran programa que s’encalla — i el teu departament financer també.

La veritat poc glamurosa és que “fer IA” és sobretot “posar les teves dades en ordre per a un bon cas d’ús”. Fes això i el model gairebé es cuida sol. Si vols una lectura sense filtres d’on són les teves dades i el projecte més petit que demostraria valor, oferim una avaluació gratuïta — mira les nostres pàgines d’integracions d’IA i integracions per API, o comença una conversa.

Et sona aquest problema al teu negoci?

Construïm IA de producció — assistents, agents i automatització fonamentada en les teves dades. Trucada inicial gratuïta i pressupost tancat per escrit, sense compromís.

Demana la teva proposta gratis