回忆, 怎么找呢 ========================== 回忆, 可能记在笔记本里, 可以融一段旋律里, 或者一场雨, 一片云, 甚至是一个 emoji . .. meta:: :keywords: search engine, database, sql, seo, nosql | 一个人不想往未来看的时候, 就会往回看. | | 然而回看的时候, 总是七拼八凑, 有时候是像素化的, | 更多时候像考试抄人家答案, 只抄到了“由此易得 XXX ” 的结果, 这时候他就焦躁得像小猪佩奇里的猪爸爸. | | 所以, 我就来谈谈怎么搜索自己的回忆. 回忆是存在抽屉里的, 还是串在绳子上的 --------------------------------------- | 关于回忆, maybe 你比较有印象的是你爸妈给你量身高的那面墙, 每隔一段时间, 就划上一条杠. | 那儿时的欢快, 就在那偶尔宽, 偶尔窄的间距里. | 而人类最早的记忆, 也无非如此, 比如 结绳记事. | | 这种像绳子一样的记忆, 其实就是一种时间序列. 间隔可以是天, 月, 年. | 如某某人说, “我上次吃西瓜是昨晚, 我上上次吃西瓜是上周六 ”, 诸如此类, 就是一条时间序列. | 当然, 一条时间序列, 都是描述同一件事. 如果要描述两件事, 就需要两条绳子, 描述很多件事, 就需要很多条绳子. | 聪明的你, 肯定想到了, 把这么多条绳子, 并排在一起, 不就是筛子嘛. 或者称为 表格型数据. | 所以呢, 数据的定义, maybe 就是 “经历的重复” :-) | 我们可以用 excel, mysql, airtable 很多软件来记录这种表格型数据. | | | 表格是个好东西, 它可以记录一些流水类的东西, 比如会计, 交易信息, 用户信息等等. | 但表格总是缺乏魅力, 也就是说不感性. | 比如一首歌, 一首诗, 一幅画, 一片风景, 这些总不大好记录. | 如果有一天一个二傻子, 跑过来给你个绳结, 告诉你这里面有一幅画. | 你不把他打成筛子才怪. | | 所以, 这种回忆只能放在盒子里了. 比如说, google doc, html, xml 都可以很方便的记录这些美好. | 它们都是一种抽象方式, 作为一个盒子, 可以包含其他盒子, 也可以链接其他盒子. | 这些盒子, 就像印度纪念亡灵的水灯一样, 散布在你人生的河流. 回忆该怎么找呢 ---------------------- | 我们已经了解到, 数据可以像绳子一样串在一起, 也可以像盒子一样飘散在各处. | | 对于绳子型的数据, 查找起来很方便, 通过二分法, 很快能找到何年何月, 何事何地. | 但, 感性的人, 对盒子类的回忆 maybe 会更有感时花溅泪的偏好. | | 所以, 为了更快的找到你记忆中的盒子, 我有个好办法: | - 在盒子上面贴标签. - 每个盒子尽量和其他盒子产生连接, 比如互相引用. - 在盒子上面添加元数据, 也就是描述盒子的信息, 比如(What, Who, Where) | 当然, AI 有的时候会自动帮你整理盒子, 告诉你照片拍摄在哪, 识别出照片里的人, 风景. | | Ok, Google, “给我找一下吃西瓜看世界杯的照片 :-) ” | Sorry, 404. 还是来谈谈搜索引擎吧 --------------------- | 我一直认为搜索引擎是后端工程师的王冠(这也是我喜欢 Google 的一个理由). | 搜索引擎的数据存储和查询看起来简单, 实则包罗万象. 既有基础的排序算法, 也有前沿的机器学习的推荐算法. | 未来的搜索引擎将变得更加个性化(事实上已经如此了) 推荐书籍: - Search Engines: information retrieval in practice. (https://github.com/yowenter/books/tree/master/Information%20Retrieval) .. feed-entry:: :author: taogoo :date: 2018-07-07