文件格式——电子书:ePub
简介
EPUB(Electronic Publication的缩写,电子出版)是一种电子图书标准,由国际数字出版论坛(IDPF)提出;其中包括3种文件格式标准(文件的附文件名为.epub),这个格式已取代了先前的Open eBook开放电子书标准。epub格式对于复杂的排版,图表,公式等元素的兼容性比mobi格式好很多,在脚本,公式,矢量图形的支持方面也强过mobi格式,现阶段epub格式的优势体现在图文混排、图片嵌入字体等,未来可预测的优势是epub格式对于声音,影像等多媒体内容互动的支持上。
代码
epub格式是印刷出版界常见的格式,本格式遵循XML原则把网页进行压缩打包。
// 动态库下载地址 https://epubreader.codeplex.com/,添加引用eBdb.EpubReader.dll// 头部增加引用using eBdb.EpubReader;string fullfile = @"E:\佛学资料\EPUB\般若秒瓶.epub" ;Epub epub = new Epub(@fullfile);//Get book title (Every epub file can have multiple titles)// 获取epub文章标题string title = epub.Title[0];//Get book authors (Every epub file can have multiple authors)// 获取作者string author = epub.Creator[0];//Get all book content as plain text// 以纯文本格式获取图书内容string plainText = epub.GetContentAsPlainText();//Get all book content as html text// 以html 格式获取图书内容string htmlText = epub.GetContentAsHtml(); //Get Table Of Contents (TOC)// 获取目录List navPoints = epub.TOC;//获取目录数量int cnt = navPoints.Count;//获取目录序号int j=1;// 获取目录标题string contenttitle = navPoints[j].Title.ToString();// 获取子目录标题(假设有子目录)string childtitle = navPoints[j].Children[0].Title.ToString();//Get some part of book content// 获得部分文章章节,序号是把大小目录在一起排序的/*一、章名* 1、节名 1* 2、节名 2 */ContentData contentData = epub.Content[j] as ContentData;//获取目录内容(默认只取第一级目录)// 获取文本格式内容string content_plaintext =navPoints[j].ContentData.GetContentAsPlainText().ToString();//获取HTML格式内容string content_html =navPoints[j].ContentData.Content.ToString();
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
