Tips: google book 的保存、浏览和打印方法(转载)
google book很显然是个好东西,但限制多多。这两篇博客教我们如何突破限制。孔已己老先生都说了:窃书不算偷。
地址一: http://blog.sina.com.cn/u/453e42ee010003t0
关于google books书籍的下载方法
什么是google books
google books是Google近来增加了新的搜索引擎,其中包含相当数量的图书,据说是和多家大型图书馆合作,目标是在10年内建成世界上最大的网络图书馆。但是google的目的并不是给人下载,而是供读者简单检索以向出版商和书店购买该书,因此也没有任何收费项目。其图书目前采取的是图片的方式,大部分图书均包含所有页面。
在打开 http://books.google.com的页面输入查找的关键字,搜索。得到包含该关键字的ebook,选择一本书进入
因为版权问题,google的书并不是每一页都能看,它只允许你浏览一部分(官方说法是20%多吧)。而且书中的每一页均是gif图片,在一般的浏览器中受到保护,只能看,不能下载。
所以对每个找书的人来说,现在的问题就是:先:能看到的页能下载下来吗?进而:不能看到的页能通过什么方法看到吗?
对于第一个问题,可以说是已经解决,方法用很多,试用后,感觉最方便的还是用firefox及几个java插件的方法了。
步骤:
1.安装firefox;
2.用firefox打开网址
http://greasemonkey.org 选择信任站点,安装
3.重新打开浏览器firefox,打开地址 http://diveintomark.org/projects/butler/
右击链接Download version 0.3 of April 14, 2005,选择install user script
4.重新打开浏览器firefox,检索http://books.google.com/ 打开电子书。右击图片,可以选择保存了。
接下来解决第二个问题:
如何看完整本书
因为goole books限制了上下只能看三页,达到三页后,到下一页的按钮会失效。
一个相当笨却行之有效的方法是在所能达到的最后一页搜寻某单词检索,在结果中找到该页,打开可以继续向下看。亦即:
一开始打开第一页,于是可以达到第三页,在第三页搜寻某单词,检索后返回若干结果,找到第三页,打开,于是可以到达第五页,以此类推。
但这样的方法都太费时费力。
通过偶的仔细揣摩,偶发现可以通过组合关键字利用左边的search in the book来解决这个问题。search in the book这个工具可以在在书内检索,把符合关键字的页面给出链接,所以,我们可以找几个这个书的常出现的词,组合起来,来达到覆盖所有页面的目的。
比如:market mircostructute theory这本书
常用的关键字有:market,stock,information,spread,volatility等,其实有个窍门,如果这本书定量的东西比较多,大可用数字来作关键字覆盖书,经实验,用1 2 3 4 5就可以覆盖大半本书(这里有个问题,不能采用太常见的英文单词,如:is the a 等,google会忽略它们的)
这样,我用market OR 1 OR 2 OR 3 OR 4 OR 5就把288页的整本书全覆盖了,这样就克服了google的上下三页的限制。(令人汗的是,在国外一个讨论google print的论坛上,看到别人发现一个非常好玩的bug:只要在search in the book工具栏里输入200,不管任何书,都可以把页面链接全显示出来。我已经检验过,绝对管用,不知道是不是google内部人故意留的)
找到每页的链接,但这时也很难把书看完,大概看个10页左右,会提醒你输入你的google帐号(包括gmail等服务的帐号均可),输入后,又可以 看个20 左右。然后会再跳出页面限制你继续看。这时就没有办法了。因为其中涉及到goole的cookie,如果不更改cookie,你将只能等待24小时,以使得其失效。
通过使用不同的google的帐号。为此,我注册了10个以上的gmail,当一个帐号下载受限时,注销,换另外一个上,每个帐号可下20左右,于是,这样基本可把google允许下的所有页面下载完,如那本market microstructure theory,共288页,偶下了能下的250多页(为什么说是google允许下的全下了呢,因为google的每本书都有一部分页面是怎么也不让浏览的,页面链接提示为Sorry, this page’s content is restricted.每本书大概10%-15%左右)
但是现在,登陆gmail账户好像特别困难,好像一天只能登陆一次,一部计算机也只能登陆一次,加代理的方法不知道是否行的通?下次试试,不过好像google的代理很难找。
地址二: http://www.blogboy.net/user1/1262/archives/2005/49661.html
原创+总结:googleprint改成Books.google.com后看全文技巧。
MaTToiD 发表于 2005-12-7 1:05:07
greasemonkey 插件现在已经更新到0.5.3了,butler的脚本也因google print改名为google books而不能在书页上弹出右键。导致以前的google print下载方法不能奏效。但是google books又太好用,只有自己想办法了。办法很简单用ie就好了,看你想要的那几页,然后到IE临时文件夹里找几十k的jpg文件,book.XXXXX打头的,注意最好提前清空一下临时文件夹。考出来,用acrobat 作书,然后A4横向每页两张打印,然后对折就是一本很好的书了。
Notes:
1、有人发布了bulter的修正,但是我测试不好用,你可以自己再试一下。
1 装firefox;自己找下载地址吧,baidu和google能搜索很多。
2 安装greasemonkey插件:
用firefox打开网址
http://ftp.mozilla.org/pub/mozilla.org/extensions/greasemonkey/greasemonkey-0.5.3-fx.xpi
选择信任站点,安装。此时要重新启动firefox,使greasemonkey插件起作用。
3 安装修正的butler脚本:
请先下载下面的附件, 解压,打开浏览器firefox,用firefox打开附件脚本文件,再从“工具”-“Install this user script”,弹出新窗口,确定。
这样,该插件就能够像以前在google print下使用了。
如果以前安装过上述的1-2步或1-3步,您可以直接按第三步操作,以更新butler插件。
UploadFiles/2005-12/127314930.rar
2、限制页完全可以同过使用不同的gmail帐户登陆除去,至少我现在遇到的是。要邀请发信到DENGNAN@GMAIL.COM。
3、黄色高亮部分可以同过删除地址栏中的dq=后面的搜索字符在回车进入,而删除。
4、这是小木虫上的方法,以前用过,感觉可用但是不好用,改book以后没式过。但也转过来作为参考:
print google 直接下载Adobe 格式电子书的实现
print google一般情况下只能看不能下载,现已有专家已探究出存档为图片形式的东西。我在这里探讨一下如何直接下载,实现adobe形式的电子书籍。
工具。实现adobe格式的电子书下载,需具备三件工具。一是Touchnet浏览器;二是Adobe professoral 7. 三是IE浏览器。不要告诉我说没听说前这两件东西,上百度search一下,多的是,赶紧装上,我们就靠它了。下面我们开始干活了。
1. 打开Touchnet浏览器,在地址栏中输入http://print.google.com,找到并打开你要的书籍。在touchnet浏览器工具栏的下拉菜单中找到克隆该页,存盘。好了,Touchnet浏览器的使命任务就完成了。
2. 找到你刚才克隆的文件夹,在文件夹里发现有许多以*。mht格式存放的文件,找到你的书籍,仔细看,就是那个以你那本书命名的一个文档(比如,我要下载一本名为“Real Life Economics”的书,在该文件夹中就有一个“ Real Life Economics- Google Print.mht”文件,点击两下打开。
3. 如果你的浏览器默认的是IE,这时就会以IE浏览器重新打开你刚才存的哪一页。让我们看看为什么要IE,它有什么作用?由于你安装了Adobe professoral 7,这时你可看到IE浏览器的右上角(或左上角)有可以将html格式的文件直接转换成adobe格式的标志(通常,点击它就可保存为adobe格式的文件)。所以IE的作用就是通过它将刚才的文件转为adobe的格式。
4. 点击IE浏览器的右上角的adobe, 开始转换,不对!!,出来的是”adobe had an error converting to PDF”,失败了。兄弟别急,操作程序不对。这时我们改变策略,先点击翻页(见书的右上角,不管往前翻或往后翻都行),这时再点adobe,这时就可转成 adobe的pdf格式了。呵呵,不过别高兴太早,看看,pdf文件中除有翻页符外居然是白板一片,还是啥也没有。小样,我今天不信就整不了你了!!在 adobe中继续翻页(不管往前翻或往后翻都行都行),看到没,文件出来了,这就是你要下载的文件,往后翻是后一页,往前翻是前一页,好了,都存在pdf 文件里了。如果你要看整本书,按以前专家说的方法在pdf文件里的“Search within this book”输入你要找的页码或单词,呵呵,照样出来,还是pdf格式的。赶紧存盘吧,大功告成了。
说明:这里只讨论如何将print google 存为pdf格式,并不探讨如何看全书(呵呵,我也想知道),所以别问我如何把整本书存下来,但如果你能把整本书看下来,这种方法肯定能把这本书转为pdf格式的电子书。
No comments:
Post a Comment