2009년 11월 3일 화요일

pdf 를 txt 로 변환해서 nuut 로 읽는 방법 적어둔다.

오늘 아이리버 스토리를 구경했는데 흠... 괜찮군.
일찍산 내가 병신이지.
이넘들은 누트2 나오면서 누트1은 아예 신경 끈것 같고. 헐


어쨌건 비싸게산 누트를 써먹어야 하니까.. pdf 를 txt 로 변환하고 euc-kr 로 바꾸는 방법을 적어둔다(리눅스에서). 사실 pdf 읽기는 거의 포기하고 html 을 txt 로 바꿔서 읽는것 위주로 활용했는데 pdf 쪽도 어떻게든 읽어봐야겠다.

  1. pdftotext 로 pdf 를 text 로 변환
  2. iconv -f utf-8 -t euc-kr//TRANSLIT foo.txt > bar.txt 로 euc-kr 로 변환.. 누트1은 유니코드 지원따윈 없다.. 제길슨

텍스트만 뽑아내는거라.. 기술문서 읽는건 거의 불가능.
허무하군.


댓글 없음: