今天发现Kindle笔记可以导出一个.csv
文档,并可以发送到我的邮箱。如此我就想利用这个Kindle笔记.csv
文件,写一个Python小程序,将.csv
文件转化为.md
文档,然后将这个.md
文档部署到我的Blog上来。
利用kindle导出的csv文档
前处理:把csv文档中前面几行多余删除,并删除以加星标
这一列。
具体的代码如下:
1 | import pandas as pd |
关于kindle导出笔记csv文档的bug
但是kindle
导出的pdf
文档和csv
文档是有bug,导出的每段摘抄后面两个字符都会丢失,导致整个笔记并不完整。而且kindle的内置导出功能还只能到处在商城购买的书籍,第三方电子书是没有导出按钮。
为了解决这个问题,我利用了第二个工具kindle mate。这是一个导出kindle笔记的工具,可以导出任何文档的笔记内容,包括第三方电子书,使用很方便。
为了方便整理笔记,我设置kindle mate
的导出笔记只有标注和笔记两个内容,并且按时间升序排序,旧的在前。
注:这里导出的文件需要另存为utf-8
格式。
然后写了一个简单的Pyhon
代码将导出,并格式化:
1 | import codecs |
结果达到我的预期,关于最终效果可以点击查看王小波全集。