主页 > 事例事件 >恭喜老爷,ISBN 资料开放了,不过要改进的还很多 >
2020-07-09
先向大家报告一个好消息。过去呼吁多年的 ISBN 开放资料,上週终于发现它已经出炉(一阵子)了。似乎业内知道这件事情的还不多,这里简单介绍一下。经过国家资料开放平台协调,国图书号中心,终于释出了 ISBN 的开放资料 xml 档。主要是前一个月分预计会出版的图书资讯,栏位包括:书名、作者、出版单位、版次、出版年月、标题、类号及ISBN。xml 格式长得像这样:
<书名>咖哩香肠之诞生书名>
<作者>乌韦.提姆(Uwe Timm)着; 刘灯译作者>
<出版单位>台湾商务出版单位>
<版次>二版版次>
<出版年月>103/05出版年月>
<类号>875.57类号>
978-957-05-2919-7 (平装, NT$260, 203面, 20公分)
此外授权方式採用的是政府资料开放平台标準的规範:
「以无偿及非专属授权方式授权使用者得不限时间及地域,重製、改作、编辑、公开传输或为其他利用方式,开发各种产品或服务。」
基本上就是爱怎幺用就怎幺用,不需要另外申请,也不用支付额外费用。这真的要表扬一下书号中心从善如流,把业界呼吁多年的事情落实了下来。不过本于精益求精的精神,避免国图好意白费,以下建议几个关键问题,希望书号中心能够考虑更新:
新书快报就是要快,书一上市就要通知,这才符合市场的需求,如果加值商能够获取的资讯都是上个月的资料,这种缓慢的速度一定是失败的。
书号中心也许会担心,书号一编配就送出来,很多书都没有出版,因此会有资料不準确的问题。但其实书号中心累积并且递延一或两个月才释出资料,并不会让资料更可靠。对所有加值商而言,不管是最新申请的,或者递延几个月才释出的书号,他们都必须验证是否已出版,才能做商业化使用。
所以 ISBN 资料应该在第一时间就释出,才是对后续加值有意义的做法。不然厂商拿到的都是旧资料,市场上根本没有竞争力可言。这样加值运用的效益欠缺,书号中心开放出来的美意也就等于落了空。
最好还能像环保署的空污资料那样,每小时自动更新。当然 ISBN 不需要快速到每小时,我的重点是「自动更新」,这样效率才会高。
随手举例,如果想做网路书店,你不可能只买最近几个月的新书,你没有过去五年,甚至十年的出版书目,怎幺开店做生意?
或者做读书社群(像豆瓣网那样),读者上传他的藏书,那个书目範围甚至会到二十年、三十年以上,没有那些书目做基础,读者上传几本书号,就发现这个找不到,那个找不到,这种社群也是经营不起来的。
历史资料越完整,能做的事情越多。我建议书号中心应该多做一个固定型的历史档,就像这个古籍书目资料那样,做好就好了,它不用更新。所以书号中心光是 ISBN 至少就应该释出三种资料集出来:
台湾出版图书历史资料(1989-2013)
台湾出版图书资料(今年以来)
台湾出版新书预告书讯(最近三十天)
第一种是固定不变的,第二、三种则是逐月甚至每周更新的。这样的资料集,对后续应用才会有意义。
<作者>栏位中,有作者,也有译者。
虽然这些「资料」确实是放在 XML 格式中,但对程式而言,他们只是文字,还不是数据(data)。
看起来书号中心现在的作法只是把手工填写的格式,转到 XML 上,并没有真的对「资料库」的资料做优化。如果国图的原始资料也是这样不清不楚的话,其实你自己事后要做图书数据分析,应该也会觉得痛苦才对。
有了 ISBN 的开放资料,后续可以运用的加值方案很多,其中有一个是出版产业迟到了二十年,而且看起来也会继续迟到下去的出版业 EDI(电子资料交换),我们下期来谈。(更多老猫文章请看老猫出版侦查课)