La paradoja del autocorrector

IMAGE: Spell checker mistakes (in Spanish)

Recurro al viejo chiste del autocorrector ortográfico para reflexionar sobre cómo es posible que una función tan aparentemente sencilla como esa siga todavía anclada en una filosofía tan pobre como la de la comparación con un diccionario genérico, que sabemos que provoca tantos y tantos resultados incorrectos: en efecto, la comparación de una palabra tecleada contra una base de datos de palabras genéricas se deja muchas cosas en el tintero, y además, deja pocas oportunidades a la personalización.

¿Cómo es posible que en un tema como la escritura, en el que la mayoría de los usuarios cuentan con un importante archivo de textos escritos por ellos mismos sin más que abrir su proceso de textos, su correo electrónico o una red social, sigamos utilizando correctores completamente genéricos que únicamente aspiran, como mucho, a incorporar algunas de las palabras que el usuario utiliza habitualmente? ¿Cómo es posible que esos correctores no eliminen de manera completamente automática y sin siquiera molestar al usuario los tan habituales typos, los errores tipográficos que ocurren cuando se pulsa la tecla de al lado?

Un porcentaje elevadísimo de mis errores ortográficos son typos completamente accidentales. Esos, sinceramente, me irritan todavía más, porque me parecen todavía más sencillos de corregir. ¿De verdad cuesta tanto entender la disposición del teclado, y que cuando una palabra incorpora la letra de al lado en lugar de la que corresponde, debe ser corregida? Mis errores tipográficos más habituales son, por ejemplo, dar a la tecla «ñ» cuando quiero poner un acento, o a la «k» cuando pretendo escribir una «l». Esos son los mñíos (mira, este lo voy a dejar para demostrar que efectivamente es así :-) y resultaría enormemente fácil entenderlo con solo inspeccionar unos cuantos textos escritos por mí. Cada persona, imagino, tendrá los suyos, y los verá repetidos de manera más o menos habitual. También hay palabras que se me atraviesan y que, paradójicamente, uso muy a menudo, como escribir «emrpesa» en lugar de «empresa» (que ya tiene su gracia, siendo profesor en una escuela de negocios!)

¿Tan difícil es para un algoritmo de machine learning inspeccionar los textos de una persona, entender cuál es de verdad su vocabulario habitual y los errores más frecuentes que comete, y dejar de martirizarle con sugerencias incorrectas o con subrayados en rojo? Que sí, que obviamente ya sé que puedo añadir términos al diccionario, y que hasta puedo configurar sustituciones en mi procesador de texto habitual, pero en primer lugar, eso no lo hace casi nadie (será por algo), y además, solo funciona cuando lo hago en el programa para el cual lo configuré. ¿Por qué no poder tener nuestro propio corrector ortográfico a modo de asistente personal, que entiende qué teclas están al lado de qué otras en el teclado – y por tanto son errores más habituales, y en la mayor parte de los casos inconfundibles? ¿Y que lo haga, y además bien, para todos los idiomas en los que habitualmente escribo?

En plena época del RPA, o Robotic Process Automation, ¿no podemos de verdad hacerlo mejor a la hora de automatizar y personalizar un proceso como el de la escritura, en el que contamos con infinidad de ejemplos para poder adiestrar un algoritmo? Si nos vamos a pasar media vida delante de un maldito teclado, intentemos al menos que los errores más sencillos no se conviertan en una pérdida infumable de tiempo, ¿no?


This article is also available in English on my Medium page, «My spell-chekcer is dribing me carzy!«


18 comentarios

  • #001
    Mauricio - 27 noviembre 2020 - 22:42

    Enrique, a veces no sé si ciertas cosas no suceden porque son más difíciles de lo que parecen o por mera dejadez de los encargados. En lo que a mí respecta, mis errores tipográficos se deben a que usualmente escribo en alemán y en español en teclados QWERTZ (alemanes). A la hora de escribir en nuestra lengua, en un caso solo puedo optar por la disposición de España, en el otro únicamente elegir las combinaciones de teclas propias de la Mac y en un tercero tengo el teclado latinoamericano.

    Qué bueno sería que las laptops no vinieran con un teclado con letras pintadas sino con uno que permitiera efectivamente verlas en una nueva ubicación cada vez que se cambia la disposición, de modo que no suceda que cada vez que escribo en español deba pulsar la letra «z» para que me aparezca la «y» o presionar «ö» para escribir la «ñ». Los problemas, además, se incrementan cuando se trata de signos de uso menos frecuente.

    • Enrique Dans - 27 noviembre 2020 - 22:46

      Doy fe de lo del cambio de teclado. Mi error con la “ñ” empezó cuando volví de Estados Unidos, tras cuatro años usando teclado en inglés…

      • Fran - 28 noviembre 2020 - 00:26

        Es por todo esto que aunque llevo 3 años en Inglaterra con teclados ingleses, en Windows mantengo el layout español, independientemente del idioma en el que escriba. Para los caracteres muy raros miro una imagen que tengo guardada en el escritorio.

    • Lua65 - 28 noviembre 2020 - 08:08

      Siempre os podeis hacer con un Optimus Maximus de Art. Lebedev, unos 2000€ XDD

      El Maximus Popularis creo que es mas barato…

      https://youtu.be/yFnhblzr8_w

  • #005
    Gorki - 27 noviembre 2020 - 22:45

    Competa mente de a cuero

    • Angel "El Bueno" - 28 noviembre 2020 - 00:41
  • #007
    Ignacio - 27 noviembre 2020 - 22:59

    Seguramente aquí el problema no es tanto técnico como económico, político o de privacidad.

  • #008
    Gorki - 27 noviembre 2020 - 23:17

    Patenta tu idea, es una mina.

    ¡¡¡ Hagase blogger sin esfuerzo !!!

    ¿Qué mejor y mas actualizado conocimiento de lo que pasa que saber lo que estas a punto de escribir incluso antes incluso de que lo hayas editado?

    ¿Cómo es posible que a estos «mariscadores de datos», se les haya pasado por alto la posibilidad, no solo corregirte en la «nube» lo que escribes, sino incluso escribirte los artículos, con ayuda de la GPT-2?

  • #009
    jose luis portela - 27 noviembre 2020 - 23:41

    A mi personalmente lo que me tiene mas sorprendido es el corrector de gmail dando respuestas al mail que te mandan. Eso si que está bien hecho. En mi caso cuando contesto frases cortas, al menos un tercio de las veces lo uso, porque coincide con lo que quiero responder

    • Enrique Dans - 28 noviembre 2020 - 00:24

      Totalmente de acuerdo, ese es tan bueno que es hasta un poco spooky!! Como tal, no es estrictamente un corrector ortográfico, es más bien un asistente conversacional, pero sí, es impresionante!

    • Javier - 28 noviembre 2020 - 00:30

      No es el corrector. Entiendo que te refieres a Google Smart Reply, en el que una especie de inteligencia artificial «lee» el contexto de tus correos y aprende de ellos, ofreciéndote las respuestas que considera «adecuadas». Y cuanto más contestas usándolas, más lo entrenas y más aprende.

      Si entendí bien a lo que te refieres.

  • #012
    Manel Sayrach - 28 noviembre 2020 - 09:12

    Hola Enrique,
    Imagino que será cuestión de tiempo que avancemos en esa dirección. Existe el proyecto de Google, Google’s Early Adopter Program, que va en ese sentido, de momento únicamente para escritura en ingles y dentro de Docs. Aquí un artículo que habla del mismo
    https://andro4all.com/2018/08/google-docs-corrector-textos-ia
    Un saludo

  • #013
    Luis - 28 noviembre 2020 - 11:03

    Creo Enrique que lo que estás proponiendo es una aplicación que pudiera usarse con cualquiera de las plataformas / dispositivos en las / los que normalmente escribimos y que tuviera inteligencia artificial detrás. Dicha inteligencia podría estar formada por inteligencia generalista e inteligencia personalista – con los errores que uno comete habitualmente y que tú comentas en tu post.

    Dicha aplicación se iría haciendo más inteligente con el paso del tiempo en ambas dimensiones (general y particular). Creo que podría ser algo así que solucionará tu “prolbema” Enrique y muchos otros. Algo ya disponible en esta dirección? Por favor avísame que estaré interesado.

  • #014
    Xaquín - 28 noviembre 2020 - 15:26

    Curiosamente esat entrada tiene mucho más que ver con la anterior de lo que puede parecer asimple vista.

    Unha buena diferencia entre chapar y memorizar, es que la chapatoria no tiene instalado el necesario corrector (global, no solo ortográfico) para retocar aquel texto (incluso imagen, si lo tienes actualizado) que intentas sacar del almacén neuronal.

    Una memoria que se recie (auténticamente «profesional») no permite que vuelvas a meter en la RAM de tu cerebro, algo que viene mal escrito de tu ROM. No hay aplicación digital, capaz de hacer lo que hace un cerebro humano bien entrenado.

    «Repito» lo del otro día, memorizar, con un almacenamiento eficiente de los archivos (y mecanismo autorregulador), no es lo mismo que chapar, o sea almacenar al «tuntún», recuperando la información con el mismo nivel de imprecisión que pudiera tener cuando se gravó.

    Pero esta afirmación, es algo que aún no le entra en su coco, a una mayoría del profesorado.

  • #015
    LEON - 28 noviembre 2020 - 17:22

    La escritura fue el medio que se inventó para almacenar y comunicar información en una época ya pasada, en la que no se disponía de otros recursos a diferencia de lo que hoy tenemos.

    La supervivencia de este recurso se debe básicamente a la inercia, pero está destinado a su desaparición a medio plazo, salvo para casos muy específicos .

    Lo que Enrique necesita no es un corrector ortográfico de tercera generación, sino un convertidor voz-> texto libre de errores, que le evite no solo que el dedo se resbale de la tecla sino que se vea obligado a usar un anticuado teclado.

    Esta afirmación no va a gustar, hemos sido educados en el uso de la escritura desde la mas tierna infancia, nos resulta familiar y adaptarnos a otros medios nos resulta difícil. Defenderemos las virtudes de lo conocido y aprendido y destacaremos los inconvenientes de lo nuevo, pero el cambio es inevitable.

    • Gorki - 28 noviembre 2020 - 19:15

      En efecto una amigo digital mío, Javier Cosnava, es prolífico escritor de obras de literatura popular, https://www.amazon.es/Tienda-Kindle-Javier-Cosnava/s?rh=n%3A818936031%2Cp_27%3AJavier+Cosnava
      y uno de los trucos que tiene para conseguir tal producción literaria, es que dicta sus novelas a un software, que con bastante precisión lo transforma en un escrito, que produce un primer borrador, que aunque precise de corrección es mucho mas rápido que escribirlo a máquina.

      No recuerdo bien que software dijo que utiliza

      • sin censura - 30 noviembre 2020 - 15:26

        Gorki

        En MAC he probado el sistema nativo y lo hace bastante bien ( el otro día me refería a la cantidad de cosas buenas que trae de base el OS de MAC, otra cosa es su política de obsolescencia) y en el mundo Windows tenemos «Dragon Natural Speaking» que también funciona bien

        ¿El problema?

        Que sólo son útiles para trabajos como los de tu amigo, donde estás solo en un despacho.

  • #018
    sin censura - 28 noviembre 2020 - 21:09

    Editores sencillos de texto (sublime, vim) por defecto realizan bastante correctamente la corrección de errores tipográficos o los típicos acentos (se que se llaman tildes pero cada uno tenemos nuestras manías), e incluso algunos procesadores se atreven con ciertos errores gramaticales (word, libreoffice). La estrategia cuando no quiero cometer errores ortográficos es no prestar atención y al final de página o documento corregirlos. Incluso en una ventana como ésta, el procesador de fallos del MAC te las subraya de rojo. Si puedo desactivo el corrector automático porque suele ser una hoja de ruta redomada ;-)

    Nunca he apreciado que en mi idioma materno necesitara más.
    Cuando estaba realizando BUP y COU, el problema nos contaban que se solucionaba leyendo más. Y claro teniendo una educación estricta que no te dejaban tener faltas de ortografía aunque supieras la materia. Con la edad si que es cierto que he cogido vicios o dudas, que agradezco al corrector inmediato.

    Sin embargo en alemán tenía un SW especializado que revisaba declinaciones y fallos gramaticales obvios de colocación de verbos, y alguna colocación semántica. Y la pesadilla fue cuando hicieron la reforma ortográfica en 1996, armaron el lío padre, por ejemplo con palabras cotidianas como dass, con la ss y la ß… y si hubiera sido una… y luego tienes el refuerzo erróneo de textos anteriores que siguen usando la ortografía de cuando fueron escritas.

    Pero vamos que estoy con Enrique, que podrían ser mejores.

    PS: He de confesar que he repasado este texto más que lo que suelo hacer

Dejar un Comentario

Los comentarios están cerrados