2008년 11월 18일 화요일

html 을 누트로 보기위해서 lynx 를 이용 txt 로 덤프해봤다.

html 도 지원안하는 반쪽짜리 기기를 위해서 삽질을 좀 해봤다. 종종 이짓을 할께 뻔하니 적어둬야지.

  1. 구성이 깔끔하게 잘 되어있는 practical common lisp 를 긁어봤다.
  2. 먼저 인덱스 페이지를 덤프해서 링크만 뽑아냈다.
    lynx -dump -listonly http://www.gigamonkeys.com/book/ > list
  3. list 를 적당히 편집.. 내가 원하는 링크들만 남겨두고 나머지 삭제했다.

    이런식으로..

  4. 각 페이지별로 덤프! -nomargins 를 주면 왼쪽오른쪽 여백주던게 사라지면서 crlf 없이 한문단이 한줄로 나오니 이북리더에 잘 어울리는 출력이 나온다. 전에는 컬럼을 늘려주는 식으로 했었는데 노마진이 좀더 깔끔하군. 링크들을 cat 통해서 stdin 에서 받도록 - 로 마무리.
    cat list | lynx -nomargins -dump -nolist -dont_wrap_pre - >> output.txt
  5. 떨어진 output.txt 를 누트에 넣고 보니 음.. 그럴듯하게 보인다.


아 돌려본 환경은 win32 에서 lynx 2.8.6dev.17TH 버전 사용.
누트에서 대강 둘러본거라 원하는 모양이 아닐수도 있겠는데.. 누트상에서 이리저리 페이지 옮기는게 힘들어서 끝까지 확인하지 못했다.

댓글 3개:

네글자군 :

lynx라... lynx가 무엇인가요???



혹시 아주 먼옛~날 있던 텍스트 기반 브라우저는 아닐테고요 ㅋㅋㅋ

yoonkn :

@네글자군 - 2008/11/18 23:18
그 텍스트 브라우저 맞습니다. ㅎㅎㅎ

네글자군 :

허억...!!!!!!!!!!



ㅋㅋㅋㅋㅋ 충격과 공포네요 ㅋㅋㅋㅋ



아... 그렇게 되면 포스팅 하신대로 파이프를 이용해서 화면 텍스트를 전부 덤프해버릴수 있겠군요....