ollama-ebook-summary

ollama-ebook-summary

ollama-ebook-summary 是一个利用大型语言模型(LLM)为长文本创建要点笔记摘要的项目。该项目特别适用于epub和pdf格式的书籍,能够自动化提取章节并将其分割成约2000个token的小块,以提高响应的粒度。产品背景是创建者希望快速总结一系列书籍,以整合心理学理论和实践,并基于此信息构建连贯的论点。该工具的主要优点包括提高内容梳理效率、支持自定义问题查询、以及生成每个文本部分的详细摘要。

需求人群:

"目标受众为需要处理大量文本信息的用户,如作家、研究人员、学生或任何需要从长文本中快速提取信息的专业人士。该工具适合他们,因为它可以大幅减少手动总结书籍和长文本的时间,提高工作效率。"

使用场景示例:

研究人员使用该工具快速总结心理学书籍,整合不同书籍中的理论和实验结果。

学生利用该工具从长篇历史文档中提取关键事件和日期,准备考试。

作家使用该工具从自己的长篇作品中提取核心思想,构建书籍大纲。

产品特色:

自动化提取书籍章节并分割成小块:能够处理epub和pdf格式,自动提取章节并分割成易于处理的小块。

生成要点笔记摘要:对每个文本块生成要点笔记,包括加粗的标题和术语。

支持自定义问题查询:用户可以对文本的每个部分提出问题,获得更具体的信息。

支持多种模型使用:包括Ollama和HuggingFace提供的模型,用户可以根据需要选择合适的模型。

输出格式化文本:支持输出为CSV或Markdown格式,方便用户进一步处理和查看。

支持长文本处理:特别适用于长文本,如电子书,能够处理大量文本并生成摘要。

自定义配置文件:用户可以根据需要更新配置文件,以适应不同的摘要需求。

使用教程:

1. 确保已安装Python 3.11.9环境。

2. 安装项目依赖,通过命令`pip install -r requirements.txt`。

3. 下载并设置所需的模型,使用Ollama或HuggingFace。

4. 更新配置文件`_config.yaml`,设置默认的prompt和模型。

5. 使用脚本`python3 book2text.py ebook-name.epub`将电子书转换为分块的CSV或TXT文件。

6. 运行`python3 sum.py -c ebook-name_processed.csv`生成摘要。

7. 查看生成的Markdown或CSV文件,获取书籍的要点笔记摘要。

浏览量:9

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
网站流量情况

最新流量情况

月访问量

5.16m

平均访问时长

00:06:42

每次访问页数

5.81

跳出率

37.20%

流量来源

直接访问

52.27%

自然搜索

32.92%

邮件

0.05%

外链引荐

12.52%

社交媒体

2.15%

展示广告

0

截止目前所有流量趋势图

地理流量分布情况

中国

11.99%

德国

3.63%

印度

9.20%

俄罗斯

5.25%

美国

19.02%

类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图