기타

구글 클라우드 번역(2)-용어집 + 일괄 요청 번역

Aostols 2022. 4. 27. 22:16
반응형

https://cloud.google.com/translate/docs/advanced/batch-translation?hl=ko

 

일괄 요청(Advanced)  |  Cloud Translation  |  Google Cloud

의견 보내기 일괄 요청(Advanced) 오프라인에서 명령어로 일괄 번역을 수행하면 대량의 텍스트(배치당 파일 한도 100개)를 다양한 타겟 언어(최대 10개)로 번역할 수 있습니다. 총 콘텐츠 크기는 100M

cloud.google.com

 

기존에 사용했던 용어집은 그대로 사용합니다.

일괄 요청 번역에는 버킷이 하나 더 필요하므로 버킷을 하나 더 생성합니다.

 

기존과 동일한 스팩으로 만들어 줍니다.

추가로 만드는 이유는 일괄 번역은 임의의 이름으로 들어오기때문에 버킷이 비어 있어야 합니다.

 

번역용 파일은 기존 버킷에 올려줍니다.

txt 파일이고 utf-8로 맞춰 줘야 합니다.

 

예제의 json 파일입니다.

시작언어는 en, 도착언어가 es 입니다.

잘보시면 targetLanguageCodes 가 배열로 되어 있어서 여러개로 분리 할 수 있습니다.

또한 inputUri 역시 여러개 받게끔 되어 있는데 원본파일도 여러개 넣을 수 있습니다.

outputUriPrefix 는 버킷 이름입니다.

번역된 결과가 들어갈 버킷으로 비어 있어야 합니다.

 

실제 명령어 부분입니다.

json 파일 이름이 변경 되었는지 잘 확인하고 넣어 줍니다.

 

실행하고 나면 이렇게 표시가 될것인데 이전에 보았던것 처럼 RUNNING 이라고 뜨고 에러가 나는 경우가 있기 때문에 operation-id를 활용하여 내용을 확인해 줍니다.

 

SUCCEEDED 로 뜨면 번역이 완료 된 것입니다.

 

이제 대상 버킷에 들어가 보면 3개의 파일이 있습니다.

index 는 정말 인덱스로 크게 의미 없고

glossary_translation 은 용어집을 이용한 번역입니다.

그냥 translations 는 일반 번역으로 용어집 번역을 하게 되면 무조건 일반번역도 같이 진행하게 됩니다.

용어집 번역의 경우 아직 완벽하지 못하다고 느끼며 가끔 번역이 매우 튀는 현상이 발생 하였습니다.

반응형