레이블이 누트인 게시물을 표시합니다. 모든 게시물 표시
레이블이 누트인 게시물을 표시합니다. 모든 게시물 표시

2009년 11월 3일 화요일

pdf 를 txt 로 변환해서 nuut 로 읽는 방법 적어둔다.

오늘 아이리버 스토리를 구경했는데 흠... 괜찮군.
일찍산 내가 병신이지.
이넘들은 누트2 나오면서 누트1은 아예 신경 끈것 같고. 헐


어쨌건 비싸게산 누트를 써먹어야 하니까.. pdf 를 txt 로 변환하고 euc-kr 로 바꾸는 방법을 적어둔다(리눅스에서). 사실 pdf 읽기는 거의 포기하고 html 을 txt 로 바꿔서 읽는것 위주로 활용했는데 pdf 쪽도 어떻게든 읽어봐야겠다.

  1. pdftotext 로 pdf 를 text 로 변환
  2. iconv -f utf-8 -t euc-kr//TRANSLIT foo.txt > bar.txt 로 euc-kr 로 변환.. 누트1은 유니코드 지원따윈 없다.. 제길슨

텍스트만 뽑아내는거라.. 기술문서 읽는건 거의 불가능.
허무하군.


2008년 11월 18일 화요일

html 을 누트로 보기위해서 lynx 를 이용 txt 로 덤프해봤다.

html 도 지원안하는 반쪽짜리 기기를 위해서 삽질을 좀 해봤다. 종종 이짓을 할께 뻔하니 적어둬야지.

  1. 구성이 깔끔하게 잘 되어있는 practical common lisp 를 긁어봤다.
  2. 먼저 인덱스 페이지를 덤프해서 링크만 뽑아냈다.
    lynx -dump -listonly http://www.gigamonkeys.com/book/ > list
  3. list 를 적당히 편집.. 내가 원하는 링크들만 남겨두고 나머지 삭제했다.

    이런식으로..

  4. 각 페이지별로 덤프! -nomargins 를 주면 왼쪽오른쪽 여백주던게 사라지면서 crlf 없이 한문단이 한줄로 나오니 이북리더에 잘 어울리는 출력이 나온다. 전에는 컬럼을 늘려주는 식으로 했었는데 노마진이 좀더 깔끔하군. 링크들을 cat 통해서 stdin 에서 받도록 - 로 마무리.
    cat list | lynx -nomargins -dump -nolist -dont_wrap_pre - >> output.txt
  5. 떨어진 output.txt 를 누트에 넣고 보니 음.. 그럴듯하게 보인다.


아 돌려본 환경은 win32 에서 lynx 2.8.6dev.17TH 버전 사용.
누트에서 대강 둘러본거라 원하는 모양이 아닐수도 있겠는데.. 누트상에서 이리저리 페이지 옮기는게 힘들어서 끝까지 확인하지 못했다.

이북리더 누트 구입

http://www.nuutbook.com/
http://ebookinside.com/
http://cafe.naver.com/ebook.cafe

환율도 오르고 마침 누트가 약간 할인해주는 행사를 하길래 질러버렸네.
이돈이면 아이팟 터치도 살수있는 돈인데.. 뭘로봐도 터치보다 나은게 하나도 없지만
오직 액정하나 보고 질러봤다. 방금 배달받고 대강 둘러보니 가독성은 그런대로 괜찮네.

누트에 커버2개 해서 247500 원.
후럴...