Guia d'ús del poli[Traductor]

  • Published on
    02-Jan-2017

  • View
    221

  • Download
    5

Transcript

  • Guia d's del poli[Traductor]http://politraductor.upv.es/

    17.09.2013

    http://politraductor.upv.es/

  • ndex de contingutsIntroducci......................................................................................................................... 3

    1. Observacions generals...................................................................................................3

    1.1. Motor de traducci......................................................................................................4

    1.2. Traducci automtica..................................................................................................4

    1.3. Codi obert................................................................................................................... 4

    1.4. Recomanacions generals............................................................................................4

    2. Opcions disponibles.......................................................................................................4

    2.1. Opci Text...................................................................................................................4

    2.2. Opci Documents........................................................................................................6

    2.3. Opci Pgines web......................................................................................................8

    2.4. Opci TMX..................................................................................................................9

    2.5. Opci Android...........................................................................................................10

    Introducci

    El poliTraductor (http://politraductor.upv.es/) s un portal de traducci basat en Apertium (http://www.apertium.org),un motor de traducci automtica de codi obert desenvolupat, entre altres, per l'empresa Prompsit (h tt p:// w w w . p ro m p s it . c o m ), amb la qual ha collaborat la Universitat Politcnica de Valncia (h tt p:// w w w . upv .es ). Aquest motor permet fer traduccions del valenci al castell i viceversa. Les opcions de traducci sn diverses, i es poden traduir textos escrits directament a la finestra de la interfcie del traductor, documents en mltiples formats, pgines web, etc.

    La versi actual d'aquest motor de traducci es va presentar a la UPV el setembre del 2011. Des d'aleshores, hem rebut suggeriments, idees i correccions per part de la comunitat universitria i altres usuaris que ens han ajudat a millorar-lo.

    Cal remarcar que el document que surt del motor de traducci en qualsevol de les llenges que ofereix s un esborrany i que cal, imprescindiblement, fer una revisi acurada i extensa del document final.

    Esperem que aquesta eina lingstica siga til i efica per a les tasques de l'activitat docent i acadmica de la comunitat universitria i del pblic en general.

    1. Observacions generals

    Apertium s una plataforma de traducci automtica de codi obert. Aix vol dir que tots els components dela plaforma poden ser utilitzats, copiats, estudiats, modificats i redistributs per qualsevol usuari. En aquest apartat introdum molt breument quin s el funcionament general del motor, les consideracions que cal tenir en compte a l'hora de treballar en traducci automtica i algunes recomanacions generals per a un bon s i funcionament de l'eina.

    http://politraductor.upv.es/http://www.apertium.org/http://www.upv.es/http://www.prompsit.com/

  • 1.1. Motor de traducci

    La plataforma de traducci automtica de codi obert Apertium funciona amb un motor de traducci amb diversos parells de llenges, com ara catal(val)-castell, catal/castell-francs, catal-portugus, etc.

    Apertium fa servir un motor de traducci de transferncia sintctica que processa el text d'entrada en etapes, com en una cadena de muntatge: desformatatge, anlisi morfolgica, desambiguaci de categoriesmorfolgiques, transferncia estructural, transferncia lxica, generaci morfolgica i reformatatge.

    1.2. Traducci automtica

    La traducci automtica consisteix en l'obtenci d'un text en una llengua de destinaci equivalent i que preserve el contingut d'un text en una llengua d'origen.

    La cincia actual no s capa d'expressar de manera formal, mitjanant regles, tots els mecanismes que sn subjacents al llenguatge natural ni als processos mentals involucrats en la comunicaci. Aquesta impossibilitat per a obtenir una caracteritzaci precisa s un dels principals arguments que es poden donar per a explicar la complexitat d'escriure un programa d'ordinador que tradusca textos.

    La traducci automtica continua sent un problema difcil de resoldre. El problema es redueix considerablement quan les llenges implicades en la traducci estan emparentades, com ara el catal i l'espanyol o el catal i el francs. En aquest cas, les afinitats morfolgiques, sintctiques i semntiques simplifiquen el disseny d'aquests sistemes i permeten arribar fcilment a traduccions en les quals noms una part relativament petita del text s incorrecta. En qualsevol cas, si es vol difondre el text, s'ha de fer una revisi de la traducci lliurada pel sistema de traducci automtica.

    1.3. Codi obert

    El motor de traducci de la plataforma Apertium s de codi obert. Aix vol dir que pot ser utilitzat,copiats, estudiats, modificats i redistributs amb l'nica restricci que el codi font ha d'estar sempredisponible. Per descomptat, Apertium va acompanyat d'una llicncia compatible amb aquests principis, lallicncia pblica general (GPL, General Public License). El motor de traducci Apertium, les eines auxiliars,la documentaci corresponent i la majoria de les dades lingstiques desenvolupades fins avui perApertium es poden baixar des del web h tt p://ap er ti u m. s o u r c efo r g e . n e t .

    1.4. Recomanacions generals

    Per a obtenir una bona traducci s recomanable dur a terme els passos segents:

    Escriure o copiar i enganxar textos i documents que siguen ortogrficament i sintcticament ben escrits.

    Redactar textos amb oracions simples, el sistema de traducci funcionar millor que amb oracions molt complexes.

    Comprovar les errades sistemtiques per a unificar la correcci del text.

    Revisar sempre el text resultant abans de publicar-lo o difondre'l, ats que el resultat de la traducci automtica es considera un esborrany.

    2. Opcions disponibles

    En aquest apartat descrivim les cinc opcions de traducci i les funcions que actualment hi ha disponibles en el Politraductor.

    http://apertium.sourceforge.net/

  • 2.1. Opci Text

    Figura 1. Captura de pantalla de traducci de textos curts

    La primera opci s la de traducci de textos curts (figura 1), que es recomana quan l'objectiu s la traducci d'oracions o paraules soltes. Cal seguir aquestes accions:

    Escriure o copiar i enganxar el text a la caixa de text original que apareix a la pantalla. Seleccionar la direcci de la traducci que voleu obtenir: llengua origen llengua

    destinaci. Podeu seleccionar una de les direccions segents: castell catal (val) castell catal catal castell angls catal (val) angls catal catal angls castell angls angls castell

    Triar el tipus deixida que voleu veure:a) Text net mostra el text tradut pel sistema sense cap marca.b) Colors mostra les paraules desconegudes amb marques (dos asteriscos de color vermell) o diverses accepcions d'una paraula (separades per una barra vertical verda i entre claus).

  • Prmer el bot Tradueix.

    La traducci resultant apareixer en una caixa de text tradut segons les opcions que s'hagen triat.

    2.2. Opci Documents

    Figura 2. Captura de pantalla de traducci de documents

    La segona opci s la traducci de documents (figura 2). Es poden traduir documents en diversos formats. Cal seguir aquestes accions:

    Cercar amb Examina/Navega... (o Selecciona el fitxer) el document que voleu traduir. Seleccionar el tipus de document. s imprescindible que es dese el document que heu de traduir

    en el format que heu triat. A la taula 1 es presenta un quadre amb els formats possibles:

  • Nom del format Descripci

    Text Text pla codificat en ISO-8859-1/15 o UTF-8

    HTML Hypertext Markup Language

    RTF Rich Text Format, un dels formats del processador de textos Word de MicrosoftOffice

    ODT Open Document Text, format del processador de textos d'OpenOffice.org

    ODS Open Document Spreadsheet, format del full de clcul d'OpenOffice.org

    ODP Open Document Presentation, format de l'aplicaci Impress d'OpenOffice.org

    SXW Format del processador de textos StarOffice compatible amb OpenOffice.org 1.0

    DOC Document de Word de Microsoft Office 97 i posterior

    XLS Document d'Excel de Microsoft Office 97 i posterior

    PPT Document de PowerPoint de Microsoft Office 97 i posterior

    DOCX Document de Word de Microsoft Office 2007 i posterior

    PPTX Document de PowerPoint de Microsoft Office 2007 i posterior

    XLSX Document d'Excel de Microsoft Office 2007 i posterior

    Document Word XML Document de Word en format XML de Microsoft Office 2003

    LaTex Documents amb format de marcatge TeX amb accents tipus "\grave{a}"

    LaTex amb accents Documents amb format de marcatge TeX amb accents tipus ""

    Taula 1. Formats de documents possibles i significat

    Seleccionar la direcci de la traducci que voleu obtenir: llengua origen llengua destinaci. Podeu seleccionar una de les direccions segents:

    castell catal (val) castell catal catal castell angls catal (val) angls catal catal angls castell angls angls castell

    Triar el tipus deixida que voleu veure, igual que a l'opci de traducci de textos curts:a) Text net mostra el text tradut pel sistema sense cap marca

    b) Colors mostra les paraules desconegudes amb marques (dos asteriscos de color vermell) o diverses accepcions d'una paraula (separades per una barra vertical verda i entre claus).

    Prmer el bot Tradueix.

    Com es pot veure a la figura 3, el document que cont el resultat de la traducci automtica apareix en una finestra perqu el pugueu baixar amb un nom anleg al del document original, amb la notaci del sentit de traducci triat incorporada. Tamb apareix el nombre de paraules del document original que s'hantradut.

  • Figura 3. Resultat de la traducci de documents

    2.3. Opci Pgines web

    Figura 4. Captura de pantalla de la traducci de pgines web

    Amb aquesta opci es poden traduir pgines dinternet (figura 4). S'han de fer les accions segents:

    Escriure o copiar i enganxar la URL en la caixa de text. Cal comprovar que la URL s correcta ino s una redirecci a una altra pgina. Per a comprovar-ho, heu d'enganxar la URL completaque hi ha a la barra del navegador quan entreu a la pgina que voleu traduir.

    Seleccionar correctament el sentit de la traducci que voleu al men del cant superior dela dreta (llengua origen llengua destinaci).

    Triar el tipus de sortida que voleu veure:a) Text net mostra el text tradut pel sistema sense cap marca

  • b) Colors mostra les paraules desconegudes amb marques (dos asteriscos de color vermell) o diverses accepcions d'una paraula (separades per una barra vertical verda i entre claus).

    Triar la codificaci de carcters de la URL (UTF-8 o ISO-8859-15) que voleu traduir.Prmer el bot Tradueix.

    La traducci resultant apareixer en una finestra de navegador nova segons les opcions que hgeu triat iamb un enlla, a la part superior, que portar a la pgina original.

    2.4. Opci TMX

    Figura 5. Captura de pantalla de creaci de TMX

    L'opci TMX permet generar un fitxer TMX per a crear una memria de traducci a partir de dos textos:un text original i un altre amb la traducci corresponent. La memria de traducci resultant consisteix enuna srie de frases alineades: cada frase original anir associada a la traducci corresponent. Cal seguiraquestes accions:

    Cercar amb Examina/Navega... el document original que voleu traduir. Cercar amb Examina/Navega... el document tradut. Triar amb el men desplegable el tipus de documents que voleu tractar. Compte! Els dos

    documents han de ser del mateix format.

    Text RTF ODT HTML ODS PPT

    PPTX DOC DOCX XLS

    XLSX

  • Figura 6. Detall de creaci de TMX a partir de dos documents DOC

    De manera opcional, podeu afegir noves frases alineades a un TMX preexistent. s recomanabledesar el nou TMX amb un nom diferent per a evitar afegir frases que no hagen quedat benalineades.

    Seleccionar correctament la direcci de la traducci (llengua origen llengua destinaci). Prmer el bot Envia per a enviar la petici de construcci de la memria TMX.

    2.5. Opci Android

    Aquesta darrera opci us permet descarregar l'aplicaci del poliTraductor en dispositius mbils amb Android (aplicaci amb extensi .apk).

    L'aplicaci t els avantatges segents:

    No cal Internet per a fer-la servir, noms cal descarregar laplicaci.

    Tradueix textos curts i adreces web (URL)

    Es pot usar el teclat o la veu per a interaccionar.

    Permet compartir fcilment el text tradut.

    T controls accessibles per a dispositius tctils (botons per a triar la direcci de traducci, la generaci o no de marques, etc.).

    T missatges d'ajuda en lnia.