Skip to content

抓取书

抓取藏书阁的书

  1. 先抓取这个地址 https://www.diancang.xyz/foxuebaodian/19946/获取这本书的,书名,作者,,每个章节的名字
  2. 帮我重新做一个功能,抓取一本书的所有内容,以markdown存起来
  3. 抓取这个网址:https://www.diancang.xyz/foxuebaodian/19946/ 的佛系人生与作者,然后书的章节
  4. 目录结构放在collection下,先增加一个新目录叫佛学典籍,然后增加作者,作者以01,02加前缀,例如这样的结果collection/02-佛学典籍/01-释本焕/佛系人生/每章节的.md
  5. 章节的标题为markdown的文件名,前缀以1,2,10 加上,然后写一个脚本
  6. 每个章节是这样的https://www.diancang.xyz/foxuebaodian/19946/362832.html
text
7. 书名,作者,然后章节都是动态的,根据的是抓取的地址上的内容,在对应的目录结构生成出来,章节以章节.md 生成,重新弄下,这是<div class="panel-heading">
<h1>佛系人生  <small>作者:<a href="https://www.diancang.xyz/renwu/7147/">本焕</a></small></h1>
</div>结构重新帮我改写
8. 生成章节时,增加名称增加前缀01,02,再帮我修改下