argia.eus
INPRIMATU
Umap mor, es va acabar el magatzem en basc de Twitter
  • El magatzem de l'activitat en basca d'Umap Twitter va començar a funcionar a l'octubre de 2010 de la mà de CodeSyntax. En 2023 mor. Elon Muskiz ha assassinat a pesar que no sap el que som i qui som. Umap ha servit de base per a diversos serveis, ha realitzat durant diversos anys rànquings i col·leccions de txiolaris, mitjans de comunicació i traoles en basc; ha servit per a realitzar estudis sociolingüístics, ha servit per a afegir automàticament notícies comentades en Sustatu, ha servit de base per a identificar els vídeos més compartits en basc... Tots aquests serveis han mort també.
Sustatu 2023ko ekainaren 30a

El cercador d'ocells Umap va començar la seva marxa a l'octubre de 2010. Ha treballat durant dotze anys i mig i ha estat el grup de polls que ha reunit 77.132.,076. Una mica menys de la meitat, 28.618.588 en basc, de 27.019 usuaris.

Arxiu de l'entrevista en basca

Els tuits en basc que any rere any hem detectat i analitzat han estat:

Any Quantitat

----------------------

2007 -> 1.375

2008 -> 2.816

2009 -> 20.009

2010> 51.105

2011 -> 181.516

2012> 849.758

2013 -> 2.328.085

2014 -> 2.712.375

2015> 2.809.217

2016 -> 2.791.263

2017> 2.761.630

2018> 2.525.394

2019 -> 2.536.645

2020 -> 3.111.935

2021 -> 2.727.630

2022 -> 2.280.831

2023 -> 927.057

Encara que Umap comenci en 2010, en la base de dades també hi ha tuits anteriors. Com? quan es detecta un nou usuari, un mètode per a decidir si era euskaldun o no, ha consistit a demanar 200 tuits enrere i comprovar si en ells hi havia basc. L'historial d'alguns usuaris dels primers anys ja arribava així, en aquests 200 tuits. Aquestes recollides i classificacions han estat sempre programades.

Cada any hem analitzat l'ús del basc amb aquestes dades, publicant informes. S'ha realitzat el recompte de traoles, el recompte i anàlisi de les URL més compartides (anàlisi de fonts).

Seguiment de l'intercanvi d'informació i notícies

De l'anàlisi dels enllaços o URL desplegats en Txio, es va inventar un nou servei: l'informatiu automàtic, que es va integrar en Sustatun a l'agost de 2012, i que posteriorment va ser canviat de nom de la Xarxa. Això funcionava així:

  • Mitjançant umap, hi havia enllaços en els txios en basc, analitzar enllaços.
  • Adquirir part del seu contingut, la qual cosa es diu un snippet amb una captura d'imatges, i això també es va decidir en basca.
  • Quan un determinat enllaç superi un nombre mínim de tuits i un algorisme d'importància, publicar automàticament en Sustatun.
  • Entre ells, alguns, revisats per l'editor, portar la superfície.

Així, es van analitzar 7.334.784 enllaços, basats en 24.901.637 tuits en basc. D'elles, 32.247 notícies van passar a publicar a Sustatu, any rere any de la següent manera:

Any Quantitat

---------------------

2012> 1.135

2013 -> 4.155

2014 -> 3.836

2015 -> 3.962

2016 -> 4.275

2017> 4.119

2018 -> 2.904

2019 -> 1.792

2020 -> 2.704

2022 -> 1.344

2021 -> 1.754

2023 -> 267

Cadascuna d'aquestes notícies té afegides com es van comentar els usuaris per a veure les cadenes de tuits.

Tota una era de vídeos compartits

Com a ampliació del servei anterior, amb Umap també vam veure que els vídeos estaven cada vegada més presents en els continguts compartits, en els enllaços. Així, comencem a realitzar una recollida en el vídeo de Youtube (ja que aquesta plataforma tenia un API adequat, a diferència d'uns altres) i al gener de 2017 llancem el servei TBX.eus.

Així es van detectar i van analitzar gairebé 50.000 vídeos, determinant que tenien contingut en basc, que després superaven uns paràmetres de supervisió / compartició que anaven a l'arxiu i que s'organitzaven segons el rànquing dels més inspeccionats. Hi ha 36.727 vídeos així guardats en l'arxiu de TBX entre 2017 i 2023. Per exemple, al juliol de l'any passat, què va ser el més vist en basc en Youtube? Est.

Amb la parada d'Umap al març de 2023 també es va detenir, el que passa és que ha continuat carregant automàticament el contingut d'alguns canals de Youtube... Però sense complements socials, sense dades compartides, haurem de repensar també la continuïtat d'aquest servei.

Seguiment

La parada es va produir el 14 de març de 2023, quan Twitter va tancar els seus APIs obertes. Els últims trucs interessants del dia estan congelats en la portada d'Umap aquest dia.

Des de llavors hem treballat en CodeSyntax en diversos estudis tècnics. Les noves condicions API, de pagament, mereixien esforç? Hem arribat a una conclusió negativa. En les noves condicions de l'API de Twitter, necessitaríem una compta Pro per a poder continuar fent el que hem fet tots els dies durant 12 anys, amb una tarifa de 5.000 dòlars mensuals.

Si per raons acadèmiques, per exemple, justifiquéssim una petició per a tornar a treballar, això també seria inútil. Al juny s'han reduït els APIs acadèmics i Twitter ha ofert el mateix als científics socials i recol·lectors de dades que ho usaven: Tarifa 5.000 dòlars.

70 milions de tuits reunits, 33.000 notícies en basca comentades, 36.000 vídeos classificats per rànquing i dates... Val la pena guardar-les? Sí, sens dubte, bé com a base de dades gruixuda per a arxius futurs, bé com a eina de consulta, encara que Umap i TBX.eus s'hagin tancat o congelat, ens hem compromès a guardar el seu contingut. D'ara endavant intentarem organitzar-ho bé.

Mentrestant, en el cas de Sustatu, Twitter ha dificultat encara més les coses des de la parada de març: en les últimes setmanes han desactivat el sistema d'enviament automàtic de tuits i la forma de login per als usuaris. També haurem de resoldre-les.

Twitter, ha estat bonic durant tot el temps i no ha estat un treball inútil. Do Elon, ves-te a la porra.