Um pouco sobre gatos ou qual CAT escolhemos para podcasts de sincronização

Gatos não são animais simples e, embora o gato de Cheshire seja considerado o orador mais avançado dentre eles, nosso Vaska de Lukomorye não fala nada pior do que um britânico. Neste post, mostraremos como escolhemos o CAT (tradução assistida por computador) para podcasts de sincronização, qual escolhemos e por quê.

imagem

Não importa como você estuda gramática ou palavras curtas, não ajudará a entender a fala em inglês de ouvido. Para aprender a entender o significado do que foi dito, você precisa ouvir, ouvir e mais uma vez ouvir a fala em inglês. Por isso, no final de 2017, lançamos um novo produto - sincronização de podcasts - vídeos de treinamento com vídeo, áudio e texto sincronizado.

Os podcasts síncronos permitem ouvir simultaneamente a fala em inglês (o texto é lido de maneira muito legível, em um ritmo lento), ver os eventos relevantes na tela e ler a tradução do fragmento atual de fala.

Criar podcasts de sincronização é um processo complexo, mas devido ao fato de o material ter de atender à forma educacional usual (timbres típicos, articulação clara, pronúncia, próximo à referência), a tecnologia de tradução automatizada pode ser aplicada aqui. Para quem não conhece: tradução automática e tradução automática não são a mesma coisa. O termo "tradução automática" refere-se à ação em que o texto é traduzido de um idioma natural para outro usando um software especial. A tradução automatizada se distingue pelo fato de que todo o processo de tradução é realizado por uma pessoa, o computador apenas ajuda a produzir o texto finalizado em menos tempo ou com melhor qualidade.

Quais sistemas CAT analisamos ao escolher


Começando a criar podcasts de sincronização, revisamos, é claro, um amplo arsenal de sistemas CAT. Se você tentar procurar esses programas no Google ou Yandex, um dos primeiros da lista será o sistema Deja Vu CAT.

Deja Vu. Este é um programa muito simples, sem pilhas e funcionalidades desnecessárias, desenvolvido pela empresa espanhola Atril Language Engineering, especializada no desenvolvimento de sistemas de computador para automatizar o trabalho de tradutores e agências de tradução. Mas ela não tem muitas oportunidades. Dignidade - ocupa pouco espaço no computador.

Deja Vu X pode criar projetos e trabalhar com formatos Microsoft Word, Rich Text Format, Ajuda do Windows, Microsoft Excel, Micosoft PowerPoint, Microsoft Access, OpenOffice / StarOffice, Adobe FrameMaker MIF, Adobe InDesign, Adobe PageMaker marcado texto, QuarkXPress XTG, Interleaf ASCII , HTML, ASP / ASP.NET, PHP, JavaScript, VBScript, HTML Help, SGML, XML, RC, C / C ++ / Java, propriedades Java, segmentos não traduzidos IBM TM, documentos do Trados WorkBench, TradosTag TTX, Trados TagEditor BIF, Trados Arquivos e arquivos TagEditor TMX, GNU PO e POT e arquivos em códigos ASCII.

A versão Deja Vu X Standard foi projetada para tradutores freelancers que desejam ter uma ferramenta simples e conveniente para o trabalho. Ele permite que você crie projetos completos, mas falta algumas das funções automatizadas que estão na versão Professional.

O grupo alvo da versão profissional é o mesmo tradutor freelancer. Mas o Déjà Vu Professional já possui funções automatizadas como pré-tradução, pesquisa automática de bancos de dados, substituição automática de tradução para todos os segmentos semelhantes no projeto, preenchimento automático de bancos de dados e montagem automática de traduções de fragmentos armazenados em bancos de dados. O uso das funções do Lexicon permite criar glossários com base em projetos traduzidos, determinar a frequência de uso de termos e usar os glossários resultantes para controle de qualidade.

Uma versão do Deja Vu Workgroup foi lançada para agências e departamentos de tradução. Essa é uma ferramenta bastante poderosa que inclui todos os recursos da versão Professional e é complementada com funcionalidade para organizar o trabalho em equipe, gerenciamento de projetos e integração.

Servidor Deja Vu X TeaM - um sistema ainda mais avançado, permite que os usuários do Deja Vu X2 Workgroup compartilhem bancos de dados em tempo real em todo o mundo. Fornece uniformidade e produtividade, reduz os custos do projeto. Diferentes esquemas de licenciamento podem reduzir ou eliminar completamente a administração manual de projetos.

O MemoQ é outro sistema CAT amplamente difundido. Os localizadores adoram, porque, ao contrário de outros, é compatível com arquivos do Excel. Diferentes tipos de arquivos podem ser carregados no MemoQ, e não é exigente quanto ao tamanho e ao conteúdo. Mas tem uma funcionalidade incomum, e muitos usuários que têm experiência em trabalhar com outros sistemas no início enfrentam dificuldades na configuração.

O MultiTerm - um programa usado pelos tradutores para criar um banco de dados de traduções - é popular em comunidades altamente especializadas que traduzem textos sobre tópicos específicos. Uma das vantagens do MultiTerm é a capacidade de criar glossários para uso em sistemas CAT, que podem ser posteriormente conectados manualmente a sistemas automatizados. Mas também há desvantagens. O programa não possui uma interface amigável e, para iniciantes, é bastante difícil entender as configurações.

O Across também é um sistema bastante popular com uma interface simples. Mas a atitude em relação a ela é ambígua. É tudo uma questão de "transparência": os dados de design são de domínio público. Esse sistema pode ser usado se a questão da proteção de dados não for relevante.

XTM é um sistema complexo usado por grandes empresas para fins industriais. Projetado para projetos de grande escala e grandes quantidades de dados. O principal é ser capaz de configurá-lo corretamente. Então será conveniente para os usuários trabalharem com ele, eles economizarão muito tempo. Mas para tradutores, é improvável que este programa funcione.

TRADOS. Todos os sistemas listados acima são inferiores em alguns aspectos ao líder brilhante entre os sistemas comerciais - Trados. Este produto foi desenvolvido pela empresa alemã Trados GmbH e é um dos líderes mundiais nesta classe. O sistema tem um grande número de vantagens. Entre os principais - atualmente, o Trados suporta 93 idiomas (mais que todos os outros sistemas). E em termos de volume da memória de tradução, é melhor do que todos os sistemas conhecidos por nós. Das deficiências, uma interface específica pode ser observada. No entanto, a conveniência da interface é uma questão de gosto e hábito. Há problemas com o suporte de alguns formatos. É exigente quanto ao volume e tipo de arquivos (por exemplo, inferior ao MemoQ neste parâmetro). E Trados não sabe como extrair texto de imagens.

Smartcat. Este é um ambiente de navegador gratuito baseado na nuvem que permite a colaboração de toda uma equipe de tradutores. Obviamente, o SmartCAT não é o primeiro da sua classe. Mas, em muitos aspectos, está à frente dos análogos, pagos e gratuitos. Por que isso aconteceu, fica claro se tivermos interesse na origem desse sistema. Inicialmente, o desenvolvedor do SmartCAT era a ABBYY, e foi o que estabeleceu a funcionalidade ampla do produto. Hoje a Smartcat é uma empresa independente.

Por que escolhemos o SmartCAT


Considere a funcionalidade do sistema em mais detalhes. Seu principal trunfo é inúmeros recursos linguísticos que facilitam o trabalho de tradutores com textos semelhantes contendo frases e sentenças padrão. Como regra, estes são termos geralmente aceitos - técnico, jurídico, econômico, científico, etc., descrições de bens e serviços, documentação comercial e muito mais. Aqui, o papel principal é desempenhado pelos bancos de dados da Memória de tradução - bancos de dados da memória de tradução. Eles armazenam textos traduzidos uma vez. É claro que esses bancos de dados são atualizados constantemente com novas traduções.

Outro recurso importante são os glossários, que contêm termos e conceitos adotados em um determinado setor ou empresa. O SmartCAT permite acumular e manter glossários corporativos atualizados e fornece aos artistas os dados corretos. E as verificações automáticas garantem o controle de qualidade da tradução, detectando discrepâncias em termos e datas e anotando ortografia, pontuação e outros erros.

Obviamente, o SmartCAT também é capaz de tradução automática.
Esses recursos do sistema facilitam o trabalho de uma pessoa usando CAT. O sistema oferece opções de tradução para fragmentos individuais, com base em textos existentes nos bancos de dados da memória de tradução e glossários com terminologia corporativa. O tradutor pode simplesmente tirar proveito da opção proposta, editá-la ou, em casos extremos, traduzir o texto como achar melhor.

Atenção especial deve ser dada aos formatos de arquivo suportados pelo sistema SmartCAT. Sua lista é muito impressionante: bmp, dcx, pcx, png, jp2, jpc, jpg, jpeg, jfif, tif, tiff, gif, pdf, djvu, djv, jb2, docx, doc, txt, rtf, odt, xlsx, xls , ppt, pptx, potx, pps , ppsx, odp, ttx, sdlxliff, XLF, xliff, srt. Vale ressaltar que na lista acima existem muitos formatos gráficos. Este é um legado agradável da ABBYY. Muitas vezes, os tradutores precisam trabalhar com documentos não na forma de texto, mas na forma de imagens. Para extrair texto, você deve primeiro reconhecê-lo. O SmartCAT está integrado às tecnologias ABBYY OCR: basta carregar um arquivo gráfico e o sistema extrairá o texto para tradução. Se você já digitou manualmente o texto enquanto olha para uma foto, apreciará o charme de usar a tecnologia OCR.

Outro elogio da ABBYY é a capacidade de usar dicionários do Lingvo. Pequeno, mas ainda conveniente quando tudo o que você precisa para tradução está ao seu alcance.

Quando as palavras “ambiente de nuvem” aparecem na descrição do sistema, muitos usuários em potencial se debatem reflexivamente: “E a segurança? Meus dados serão roubados? Responderemos honestamente: você pode hackear qualquer coisa. Apenas a conveniência do hacking é determinada pela proporção de tempo e esforço gasto e pelo resultado. No sistema SmartCAT, os dados são armazenados em um datacenter de nível 4 e transmitidos por canais seguros, e o nível de acesso aos materiais é regulado usando um sistema de distribuição de direitos.

Concluindo a breve descrição do SmartCAT, acrescentamos que a interface do sistema é intuitiva para quem já trabalhou com ferramentas CAT: você verá o texto e a tradução originais, uma janela de correspondências com a memória de tradução e o glossário no local habitual. Há uma janela separada para pesquisar na memória, glossários e dicionários e outra janela para obter resultados de controle de qualidade, histórico de alterações em um fragmento de texto e comentários.

Bem, mais algumas funções e recursos que não podem ser ignorados


  1. O painel de gerenciamento de projetos permite monitorar os projetos atuais, prazos, volumes de transferências e artistas indicados a qualquer momento. Não há restrições quanto ao número de projetos ou ao volume de bancos de dados e glossários de memória de tradução no sistema. Portanto, podemos conectar um número ilimitado de artistas a projetos.
  2. Integração implementada com sistemas corporativos. Você pode enviar materiais para tradução e receber textos prontos diretamente em portais corporativos ou em sistemas de gerenciamento de informações implementados na empresa.
  3. Função de bate-papo. Tradutores, editores e gerentes de projeto podem discutir rapidamente questões atuais. As mensagens são exibidas na janela de comentários.
  4. O uso da nuvem fornece independência do sistema operacional que o tradutor usa.
  5. O sistema é apresentado em duas versões: para usuários corporativos e tradutores freelancers. versão Freelance é livre: Para começar, basta se cadastrar no site ru.smartcat.ai .

Total


Depois de analisar minuciosamente todo o arsenal de sistemas CAT dignos de atenção, na final, escolhemos entre dois: Trados e SmartCAT. A comparação de sua funcionalidade mostrou que aproximadamente 95% (esta é uma avaliação subjetiva do autor), esses sistemas são idênticos. Por um lado, existem mais idiomas suportados e uma maior memória de tradução do Trados, por outro lado, uma interface amigável, suporte para formatos gráficos e a capacidade de extrair texto de imagens, menos exigente no tamanho do arquivo, muitas funções adicionais úteis e SmartCAT gratuito.

No final, escolhemos o SmartCAT. E embora o British Trados (hoje o sistema pertença à empresa britânica SDL International) também seja bom em moda, o sistema CAT russo ultrapassa seu equivalente estrangeiro em vários parâmetros e é fácil de usar, conveniente e não é caprichoso.

Konstantin Gerashchenko, editor do recurso educacional on-line Puzzle English

Source: https://habr.com/ru/post/pt419649/


All Articles