sql或者python根据input输出output

新手上路,请多包涵

题目如下:
通过输入数据(input)对itemid的订单覆盖率进行排序,输出格式为output

input:

Orderid     Itemid    Quantity
001         aa       1
001         bb       1 
002         aa       1
003         aa       3
003         bb       2 
004         aa       2
005         aa       1 
006         bb       1    
007         cc       2 
008         cc       1 

output:
coverorder  itemid    orderratio   TopN
5           aa            62.50%     1
7           cc            87.50%     2
8           bb            100.00%    3

订单覆盖:比如上表的aa在5个订单出现,属于top1;虽然bb在3个订单出现,cc在两个订单出现,但是cc的订单和aa的订单不重复,即aa和cc的订单覆盖率比aa和bb组合的高,所以cc为top2,bb在最后;我有类似这种的大数据量库,需要输出这样的结果,用SQL可行吗?没有研究过机器学习,是否可以通过建模的方式,挖掘出这样的答案呢?可以理解我的意思吗?
如果有建议,不胜感激。

阅读 1.2k
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题