主页 > 事例事件 >恭喜老爷,ISBN 资料开放了,不过要改进的还很多 >

恭喜老爷,ISBN 资料开放了,不过要改进的还很多

2020-07-09

恭喜老爷,ISBN 资料开放了,不过要改进的还很多

出版还有很多东西需要解谜,还有很多事情要探索,所以我们有了出版侦查课。

先向大家报告一个好消息。过去呼吁多年的 ISBN 开放资料,上週终于发现它已经出炉(一阵子)了。似乎业内知道这件事情的还不多,这里简单介绍一下。经过国家资料开放平台协调,国图书号中心,终于释出了 ISBN 的开放资料 xml 档。主要是前一个月分预计会出版的图书资讯,栏位包括:书名、作者、出版单位、版次、出版年月、标题、类号及ISBN。xml 格式长得像这样:

 <书名>咖哩香肠之诞生
 <作者>乌韦.提姆(Uwe Timm)着; 刘灯译
 <出版单位>台湾商务
 <版次>二版
 <出版年月>103/05
 <类号>875.57
 978-957-05-2919-7 (平装, NT$260, 203面, 20公分)

此外授权方式採用的是政府资料开放平台标準的规範:

「以无偿及非专属授权方式授权使用者得不限时间及地域,重製、改作、编辑、公开传输或为其他利用方式,开发各种产品或服务。」

基本上就是爱怎幺用就怎幺用,不需要另外申请,也不用支付额外费用。这真的要表扬一下书号中心从善如流,把业界呼吁多年的事情落实了下来。不过本于精益求精的精神,避免国图好意白费,以下建议几个关键问题,希望书号中心能够考虑更新:

新书快报就是要快,书一上市就要通知,这才符合市场的需求,如果加值商能够获取的资讯都是上个月的资料,这种缓慢的速度一定是失败的。

书号中心也许会担心,书号一编配就送出来,很多书都没有出版,因此会有资料不準确的问题。但其实书号中心累积并且递延一或两个月才释出资料,并不会让资料更可靠。对所有加值商而言,不管是最新申请的,或者递延几个月才释出的书号,他们都必须验证是否已出版,才能做商业化使用。

所以 ISBN 资料应该在第一时间就释出,才是对后续加值有意义的做法。不然厂商拿到的都是旧资料,市场上根本没有竞争力可言。这样加值运用的效益欠缺,书号中心开放出来的美意也就等于落了空。

最好还能像环保署的空污资料那样,每小时自动更新。当然 ISBN 不需要快速到每小时,我的重点是「自动更新」,这样效率才会高。

随手举例,如果想做网路书店,你不可能只买最近几个月的新书,你没有过去五年,甚至十年的出版书目,怎幺开店做生意?

或者做读书社群(像豆瓣网那样),读者上传他的藏书,那个书目範围甚至会到二十年、三十年以上,没有那些书目做基础,读者上传几本书号,就发现这个找不到,那个找不到,这种社群也是经营不起来的。

历史资料越完整,能做的事情越多。我建议书号中心应该多做一个固定型的历史档,就像这个古籍书目资料那样,做好就好了,它不用更新。所以书号中心光是 ISBN 至少就应该释出三种资料集出来:

台湾出版图书历史资料(1989-2013)
台湾出版图书资料(今年以来)
台湾出版新书预告书讯(最近三十天)

第一种是固定不变的,第二、三种则是逐月甚至每周更新的。这样的资料集,对后续应用才会有意义。

<作者>栏位中,有作者,也有译者。栏位中,不但有ISBN,也有装订方式、定价、页数、开本等五种资讯,一起挤在一个栏位中。这不是合格的 XML格式标準,每个加值商如果要运用,都得重新萃取出个别值,重新放到正确的栏位中。

虽然这些「资料」确实是放在 XML 格式中,但对程式而言,他们只是文字,还不是数据(data)。

看起来书号中心现在的作法只是把手工填写的格式,转到 XML 上,并没有真的对「资料库」的资料做优化。如果国图的原始资料也是这样不清不楚的话,其实你自己事后要做图书数据分析,应该也会觉得痛苦才对。

 

有了 ISBN 的开放资料,后续可以运用的加值方案很多,其中有一个是出版产业迟到了二十年,而且看起来也会继续迟到下去的出版业 EDI(电子资料交换),我们下期来谈。(更多老猫文章请看老猫出版侦查课)

相关推荐


资讯技节科技|分享识别|平板外域|网站地图 博亿堂b8et98app_竞博app下载地址 九州bt365体育投注_e乐彩APP注册旧版 新时代赌场手机_mg游戏账号中心 新濠娱乐三元_极彩在线app下载 狗万·首页_游戏娱乐平台注册送礼金 申博sunbet代理_环球体育下载ios 万家乐国际app_众盈娱乐下载 2020下载app送38元彩金_星河网上娱乐 金沙电子app_sunbeAPP下载菲律宾 葡京网站大全app_上葡京体育app