Reseña
Luminița Hoarță Cărăușu (ed.) 2023. Limba română vorbită. Corpus și studii lingvistice. Editura Universității Alexandru Ioan Cuza din Iași
Book review
Luminița Hoarță Cărăușu (ed.) 2023. Limba română vorbită. Corpus și studii lingvistice. Editura Universității Alexandru Ioan Cuza din Iași
Cristina Bleorțu
Universitatea Ștefan cel Mare din Suceava (Suceava, Rumanía)
cristina.bleortu@usm.ro
https://orcid.org/0000-0002-1645-7932
Miguel Cuevas Alonso
Universidade de Vigo (Vigo, España)
miguel.cuevas@uvigo.es
https://orcid.org/0000-0001-7656-2374
Recibido el 17/11/2024, aceptado el 23/12/2024, publicado el 11/4/2025
Creative Commons Attribution 4.0 International
© 2025 Cristina Bleorțu, Miguel Cuevas Alonso
Cómo citar esta reseña
Bleorțu, Cristina, Miguel Cuevas Alonso 2025. Reseña. Luminița Hoarță Cărăușu (ed.) 2023. Limba română vorbită. Corpus și studii lingvistice. Editura Universității Alexandru Ioan Cuza din Iași. Studia linguistica romanica 2025.13, 95-99. https://doi.org/10.25364/19.2025.13.6.
[1] Iniciativas como la que presenta este libro son, sin duda, fundamentales y merecen un reconocimiento especial, sobre todo si consideramos el contexto en el que se inscribe. La lingüística de corpus digital en Rumanía ha tenido un desarrollo relativamente tardío en comparación con otras lenguas románicas. Mientras que en España, Italia y Francia los primeros corpus se desarrollaron ya en la década de los años 90 y en Portugal en 2014 con el Corpus de referência do português contemporâneo (CRPC), en Rumanía los proyectos como Corpus lexicografic românesc electronic (CLRE) y Corpus de referință pentru limba română contemporană (CoRoLa) comenzaron en 2014 (Bleorțu & Seiciuc 2024). Aunque se han logrado avances significativos, el número de corpus disponibles sigue siendo reducido. Ejemplos como RoTenTen, elaborado mediante webscraping y disponible en el sitio web de Sketch engine constituyen aportes valiosos, pero son todavía iniciativas puntuales dentro de un panorama que merece seguir siendo desarrollado, pues todos ellos presentan diversas limitaciones que no permiten una explotación óptima de sus contenidos.
[2] El libro Limba română vorbită. Corpus și studii lingvistice es el resultado de una investigación llevada a cabo por un equipo de seis investigadoras: Anamaria Grecu Gheorghiu, Maria Tomulescu, Ionela Chiru, Mihaela Moraru Lupu y Loredana-Aurelia Alexandrescu, bajo la coordinación de Luminița Hoarță Cărăușu, una reconocida experta en el habla de la lengua rumana, concretamente en pragmalingüística.
[3] El volumen se divide en un prólogo y dos secciones principales: una dedicada a la transcripción del corpus de lengua rumana hablada que han recabado y otra que contiene diversos estudios en los que se tratan diferentes fenómenos lingüísticos a partir del análisis de este corpus.
[4] La primera sección incluye las transcripciones de los discursos contenidos en corpus clasificados en función de su naturaleza temática y del contexto en el que se originan. Con anterioridad, en las primeras páginas del volumen se indican las convenciones de transcripción, basadas en una publicación previa de la coordinadora del volumen, entre otros trabajos. En ellas se señalan no solo estos criterios sino, también, algunos elementos de la transcripción que sirven para la anotación de aspectos relativos a la situación comunicativa, así como de cuestiones no verbales.
[5] En la primera sección encontramos al inicio de cada discurso transcrito y etiquetado todo lo relativo a la grabación: fecha, fuente, participantes, autor de la transcripción y duración. Se organiza en varios capítulos: 1) Maria Tomulescu realiza la transcripción de discursos televisivos que tratan sobre moda (pp. 11-69) y procedentes de programas como Bravo, ai stil! (20 capítulos), Levința prezintă (1 capítulo), Movie time (1 capítulo), Poliția modei (2 capítulos), Secrete de stil (1 capítulo), Vorbește lumea (1 capítulo); 2) Mihaela Lupu dedica su sección a fragmentos de discursos televisivos de programas culturales, como Serata muzicală TV (4 capítulos, pp. 70-79), Garantat 100 % (5 capítulos, pp. 80-91), Marius Tucă show (1 capítulo, pp. 92-98), Nocturne (4 discusiones, pp. 98-112), y entrevistas procedentes de distintos programas, como Profesioniștii (15 capítulos, pp. 113-156), Înapoi la argument (1 capítulo, pp. 156-162), CoolTura (2 capítulos, pp. 162-166), Mic dejun cu un campion (pp. 167-173), Gânduri bune (pp. 173-175), 40 de întrebări cu Denise Rifai (2 capítulos, pp. 176-181) y Aventura urbană (1 capítulo, pp. 181-182); 3) por su parte, Loredana Alexandrescu transcribe aquellos discursos televisivos que se enfocan en entrevistas (pp. 183-330) contenidas en programas como Profesioniștii: Entrevistas con Dem Rădulescu (pp. 183-193), Andrei Pleșu (pp. 193-211), Monica Macovei (pp. 211-229), Neagu Djuvara (pp. 230-244), Bartolomeu Anania (pp. 244-260); Mic dejun cu un campion: Entrevistas con Corina Chiriac (pp. 260-272), Alex Ștefănescu (pp. 272-286), Emil Constantinescu (pp. 287-297); Nocturne: Entrevistas con Liviu Ciulei (pp. 297-314) y Gabriel Liiceanu (pp. 314-325); COOLtura: Entrevista con Horia-Roman Patapievici (pp. 325-330); 4) en el capítulo 4, que se centra en discursos televisivos relacionados con debates, Luminița Hoarță Cărăușu (pp. 331-335) transcribe programas como Brandu' lu' Chinezu y Cap de afiș; 5) el capítulo 5 contiene discursos políticos de Victor Ponta transcritos por Ionela Chiru (pp. 337-367) procedentes de eventos de partidos políticos, congresos y lanzamientos de candidaturas; finalmente, 6) en el capítulo 6, Anamaria Grecu Gheorghiu (pp. 369-522) se encarga de discursos religiosos grabados en la iglesia ortodoxa rumana Sfântul Apostol Andrei de Viena e incluye catequesis para niños, diálogos con jóvenes y reflexiones sobre temas bíblicos y sociales; este último incluye, a diferencia de los anteriores, grabaciones propias que no son obtenidas de YouTube.
[6] Dicho esto, consideramos que, en esta primera parte, el proyecto podría haberse beneficiado de una mayor explicitación de ciertos aspectos metodológicos, que habrían proporcionado un marco más claro para comprender las decisiones tomadas. Por ejemplo, hubiera resultado útil que en la introducción se ofrecieran algunas explicaciones sobre cuestiones clave que enumeraremos a continuación: ¿cuáles fueron los criterios que motivaron la elección de los programas empleados en el proceso?, ¿por qué no se respetó un orden cronológico en la transcripción de los materiales?, ¿cómo se seleccionaron los vídeos, teniendo en cuenta la notable disparidad entre algunos muy extensos y otros sumamente breves? ¿Se recurrió a algún generador gratuito de transcripciones de YouTube? En relación con esto, si bien se menciona el sistema de transcripción utilizado, la metodología específica parece algo difusa: ¿cómo se llevaron a cabo las transcripciones?, ¿cuántas revisiones o correcciones se realizaron en total? ¿cómo se resolvieron las dudas de transcripción? Son detalles técnicos que, aunque pueden parecer menores, habrían contribuido a una mayor transparencia y a una comprensión más completa del trabajo.
[7] Un aspecto que llama la atención es el uso de entrevistas propias en el caso de los textos religiosos. Sería interesante conocer las razones que pueda haber tras esta decisión. También surge una cuestión que podría merecer cierta atención: la publicación de las transcripciones realizadas. Dado que no se menciona en el libro si se obtuvo consentimiento o si se tuvieron en cuenta aspectos legales relacionados con la reutilización de materiales de YouTube, sería oportuno incluir alguna reflexión al respecto en futuras ediciones o trabajos relacionados. Finalmente, quizá sería deseable, como volveremos a indicar más adelante, que las transcripciones se publicaran como corpus online junto con los vídeos y se realizara un etiquetado que pueda ser fácilmente accesible mediante un buscador (quizá en formato XML). Esto podría favorecer una explotación más óptima del contenido del corpus, incluso de carácter multimodal, y podría servir, de ser descargable, para su uso en herramientas de análisis de corpus como Sketch engine.
[8] En la segunda sección de este volumen encontramos una colección de trabajos que analizan diversos aspectos lingüísticos a partir de los datos obtenidos del corpus transcrito. Así, en Particularități retorico-pragmatice ale discursului televizual în emisiuni ce au ca subiect moda1, Maria Tomulescu analiza los programas relacionados con la moda, identificando estrategias persuasivas y retórico-pragmáticas predominantes. Entre estas destacan la interrogación retórica, la negación polémica, el uso de metáforas argumentativas, y técnicas como la amplificación y la repetición. Por su parte, Mihaela Lupu examina cómo los cumplidos, como marcadores de cortesía positiva, generan solidaridad y mantienen la interacción, destacando elementos verbales y no verbales que enriquecen la comunicación, y, en el siguiente capítulo, aborda el acto de gratitud como un elemento ritual y pragmático que refuerza la cortesía y media en interacciones sociales, con el fin de mostrar su relevancia en el contexto televisivo.
[9] En el cuarto capítulo de esta sección, titulado Argumentarea în discursul televizual românesc actual. Interviul, Loredana-Aurelia Alexandrescu analiza las estrategias argumentativas empleadas en entrevistas televisivas rumanas, que se caracterizan por su riqueza y diversidad discursiva; parte de tres programas representativos (Profesioniștii, CoolTURA y Nocturne) para explorar las características discursivas de las producciones de los invitados, desde figuras políticas hasta filósofos e historiadores. Si en ese capítulo aborda la argumentación, a continuación, en el capítulo Persuasiunea în discursul televizual românesc actual. Interviul, analiza diversas estrategias persuasivas en entrevistas televisivas rumanas, centrándose, nuevamente, en tres programas de televisión (Profesioniștii, Mic dejun cu un campion y Nocturne) y destaca cómo las estrategias discursivas buscan influir en la audiencia y fomentar conexiones entre los participantes.
[10] Luminița Hoarță Cărăușu aborda las marcas pragmáticas utilizadas en el discurso televisivo rumano contemporáneo, especialmente en programas culturales como los talk shows y los debates televisados, en el capítulo titulado Mărci pragmatice de contact în discursul televizual românesc actual. Inmediatamente después, en el trabajo Strategii ale politeții în discursul televizual românesc actual. Invitat – Gigi Căciuleanu, se centra en las estrategias de cortesía positiva y negativa en el discurso televisivo cultural.
[11] En el capítulo 8 de esta segunda sección, titulado Particularități retorico-pragmatice ale discursului politic actual în limba română, Ionela Chiru se centra en el discurso político en el contexto contemporáneo rumano. Finalmente, Anamaria Grecu Gheorghiu aborda, en el capítulo Comunicare verbală, paraverbală și nonverbală în discursul religios actual (Cateheza), los discursos religiosos actuales desde una perspectiva multimodal y contextualizada.
[12] Se debe indicar que, en esta segunda parte del volumen, los apartados de análisis resultan, en numerosas ocasiones, algo abruptos, al centrarse directamente en la interpretación de los datos sin ofrecer una descripción previa de la metodología utilizada o de los discursos analizados. Una breve introducción a cada sección, e incluso un capítulo general que aborde los estudios previos realizados sobre el discurso televisivo, habría facilitado el seguimiento de los argumentos y aportando claridad a la estructura del análisis mencionando, por ejemplo, el enfoque adoptado, los principios y criterios analíticos y delimitando el material de estudio.
[13] Pese a estas observaciones, este volumen resulta ser una valiosa contribución al estudio del discurso televisivo y hablado en Rumanía. Ahora bien, quizá podría reclamársele una selección más rigurosa de los elementos que configuran el corpus, evitando el uso predominante de YouTube; además, como ya hemos mencionado con anterioridad, resultaría beneficioso para cualquier persona investigadora disponer de una edición digital y accesible de los vídeos junto con las transcripciones y el etiquetado correspondiente (quizá incluyendo otros aspectos pragmáticos, gramaticales, etc.) que permitan una consulta eficiente de datos lingüísticos en el corpus elaborado; sería deseable, además, que el etiquetado se realizara en un formato y convenciones que puedan ser tratados por herramientas de análisis de corpus, lo que permitiría su comparabilidad con otros corpus de similares características pero centrados en otro tipo de discursos, televisivos o no. Por otro lado, también sería deseable completar este corpus con un mayor número de grabaciones propias.
[14] En un contexto donde el análisis de datos masivos es cada vez más relevante, esta obra marca un importante paso adelante en los estudios lingüísticos rumanos, aunque queda espacio para el perfeccionamiento metodológico y la digitalización. Por eso, es imprescindible reconocer la importancia y originalidad de este proyecto, que se presenta como pionero en un ámbito tan relevante como el análisis de discursos en YouTube. Hasta donde sabemos, este es el único trabajo de este tipo en lengua rumana, lo que le confiere un mérito indiscutible y lo sitúa como una referencia clave en el estudio de corpus digitales contemporáneos.
[15] En conclusión, este libro representa un aporte valioso y significativo en el ámbito de los estudios lingüísticos en Rumanía, especialmente en lo que respecta a la lingüística de corpus digital. Las sugerencias mencionadas aquí no restan mérito al proyecto, sino que buscan resaltar aquellas áreas en las que el trabajo podría crecer aún más, consolidando así su posición como una referencia imprescindible en el campo.
Abreviaturas y referencias bibliográficas
Bleorțu & Seiciuc 2024 = Cristina Bleorțu, Lavinia Seiciuc 2024. Big data și inteligența artificială în cercetarea lingvistică. Casa Cărții de Știință.
CLRE = Academia Română (ed.) 2021. Corpus lexicografic românesc electronic. https://clre.solirom.ro/.
CoRoLa = Academia Română (ed.) 2014-. Corpus computațional de referință pentru limba română contemporană (CoRoLa). https://corola.racai.ro/.
CRPC = Centro de linguística da Universidade de Lisboa (ed.) 2014. Corpus de referência do português contemporâneo. https://clul.ulisboa.pt/recurso/corpus-de-referencia-do-portugues-contemporaneo.
Sketch engine = Lexical computing 2003-. Sketch engine. Corpus query and management system. https://www.sketchengine.eu.
1 Hay dos erratas que quizás se pueden corregir en una edición futura: «în vederea obținerea efectului persuasiv» (p. 527) y «Amplificarea reprezintă o altă strategie argumentative» (p. 528).