视频文件上传如何排重?


例如网盘、视频等网站,当用户上传文件时,有可能传的是同一个文件,如何在存储层对其进行排重,这里涉及到文件的存储方式及校验。我再说明一下吧,例如:A用户上传了一部10G的《阿凡达》高清电影,然后B用户也上传了一部一模一样的《阿凡达》高清(前提是一模一样),这时如何解决校验(如何判断B上传的文件和A上传的文件是一样的呢?)及排重的问题?

还有一种情况是:用户A传了一部高清《阿凡达》完整的电影,B用户传了一部没有片头的高清《阿凡达》电影,其它内容一样,或者是没有片尾的《阿凡达》,这时如何排重?

大家可以根据自己的经验和理解说说自己的想法,我不要从百度、Google等搜索引擎Copy过来的答案,请不要粘贴......

视频 系统设计 算法

无聊来逛逛 11 years, 12 months ago

对大文件进行一遍hash确实很耗时, 可以采用取病毒特征码的方式, 先比较文件大小, 然后从文件随机取几段内容进行hash, 如果一样的话, 就可以认为是同一个文件。如果能容忍低错误率的话, 可以采用这个方案。

南斗来一发 answered 11 years, 12 months ago

Your Answer