明星新声与动态分享青鸟高涨 Python妙手必读，作念一个忽闪王法的玩家

发布日期：2024-11-22 06:24 点击次数：99

编程，其实和玩电子游戏有一些相似之处。你在玩不同游戏前，需要先学习每个游戏的不同王法，只消老到和活泼利用游戏王法，才更有可能在游戏中奏效。

而编程亦然一样，不同编程言语雷同有着不一样的“王法”。大到是否赈济面向对象，小到是否不错界说常量，编程言语的王法比绝大多量电子游戏要复杂的多。

当咱们编程时，淌若径直拿一种言语的训诲套用到另外一种言语上，好多技巧并不可取得最好阻挡。这就好像一个 CS（反恐精英）妙手在不了解王法的情况下去玩 PUBG（绝地求生），天然他的枪法可能万中无一，关联词极有可能在发现第一个敌东谈主前，他就会倒在某个窝在草丛里的敌东谈主的蹙迫下。

Python 里的王法

Python 是一门初见节略、深刻后愈觉复杂的言语。拿 Python 里最紧要的“对象”观点来说，Python 为其界说了多到让你记不全的王法，比如：

界说了 str 设施的对象，就不错使用 str() 函数来复返可读称呼

界说了 next 和 iter 设施的对象，就不错被轮回迭代

界说了 bool 设施的对象，在进行布尔判断时就会使用自界说的逻辑

… …

老到王法，并让我方的代码得当这些王法，不错匡助咱们写出更莽撞的代码，一本万利的完成使命。底下，让咱们来看一个关系得当王法的故事。

案例：从两份旅游数据中获得东谈主员名单

某日，在一个主打新西兰出境游的旅游公司里，商务共事须臾兴冲冲的跑过来找到我，说他从某衔尾伙伴那儿，要到了两份紧要的数据：

扫数去过“泰国普吉岛”的东谈主员及关系模样

扫数去过“新西兰”的东谈主员及关系模样

数据禁受了 JSON 局势，如下所示：

#去过普吉岛的东谈主员数据

users_visited_puket = [

{“first_name”:“Just”,“last_name”:"Malcom,“phone_number”:“267-282-1964，“datevisited：“2011-03-13”},”

{first_name”:“Albert”,"last_name:“Potter”,“phone_number”:702-249-3714,"date_visited:“2013-09-11”}

……

]

每份数据内部都有着姓、名、手机号码、旅游时辰四个字段。基于这份数据，商务同学提议了一个（听上去毫无道理道理）的假定：“去过普吉岛的东谈主，应该对去新西兰旅游也很有兴味。咱们需要从这份数据里，找出那些去过普吉岛但莫得去过新西兰的东谈主，针对性的卖产物给他们。

第一次蛮力尝试

有了原始数据和明确的需求，接下来的问题即是怎样写代码了。依靠蛮力，我很快就写出了第一个决策：

因为原始数据里莫得“用户 ID”之类的唯独标示，是以咱们只可把“姓名和电话号码王人备交流”作为判断是不是合并个东谈主的圭臬。

find_potential_customers_v1 函数通过轮回的模样，先遍历扫数去过普吉岛的东谈主，然后再遍历新西兰的东谈主，淌若在新西兰的纪录中找不到王人备匹配的纪录，就把它当作念“潜在客户”复返。

这个函数天然不错完成任务，关联词深信无用我说你也能发现。它有着终点严重的性能问题。关于每一条去过普吉岛的纪录，咱们都需要遍历扫数新西兰窥探纪录，尝试找到匹配。通接头法的时辰复杂度是可怕的 O(n*m)，淌若新西兰的窥探要求数好多的话，那么履行它将破费终点长的时辰。

为了优化内层轮回性能，咱们需要减少线性查找匹配部分的支拨。

尝试使用逼近优化函数

淌若你对 Python 有所了解的话，那么你详情知谈，Python 里的字典和逼近对象都是基于哈希表（Hash Table）扫尾的。判断一个东西是不是在逼近里的平均时辰复杂度是 O(1)，终点快。

是以，关于上头的函数，咱们不错先尝试针对新西兰窥探纪录运出动一个逼近，之后的查找匹配部分就不错变得很快，函数全体时辰复杂度就能变为 O(n+m)。

让咱们望望新的函数：

使用了逼近对象后，新函数在速率上比拟旧版块有了飞跃性的冲突。关联词，对这个问题的优化并不是到此为止，否则著述标题就应该改成：“怎样使用逼近提高关节性能” 了。

对问题的再行想考

让咱们来尝试再行详尽想考一下问题的现实。领先，咱们有一份装了好多东西的容器 A（普吉岛窥探纪录），然后给咱们另一个装了好多东西的容器 B（新西兰窥探纪录），之后界说终点王法：“姓名与电话一致”。终末基于这个终点王法，求 A 和 B 之间的“差集”。

淌若你对 Python 里的逼近不是稀罕老到，我就稍稍多先容极少。假如咱们领有两个逼近 A 和 B，那么咱们不错径直使用 A-B 这么的数学运算抒发式来计较二者之间的差集。

是以，计较“扫数去过普吉岛但没去过新西兰的东谈主”，其实即是一次逼近的求差值操作。那么要怎样作念，才气把咱们的问题套入到逼近的游戏王法里去呢?

利用逼近的游戏王法

在 Python 中，淌若要把某个东西装到逼近或字典里，一定要满足一个基本条件：“这个东西必须是不错被哈希（Hashable）的” 。什么是 “Hashable”？

举个例子，Python 内部的扫数可变对象，比如字典，就不是 Hashable 的。当你尝试把字典放入逼近中时，会发生这么的失实:

是以，淌若要利用逼近科罚咱们的问题，就领先得界说咱们我方的 “Hashable” 对象： VisitRecord。而要让一个自界说对象变得 Hashable，唯独要作念的事情即是界说对象的_ hash__设施。

一个好的哈希算法，应该让不同对象之间的值尽可能的唯独，这么不错最猛进度减少“哈希碰撞”发生的概率，默许情况下，扫数 Python 对象的哈希值来自它的内存地址。

在这个问题里，咱们需要自界说对象的 hash 设施，让它利用（姓，名，电话）元组作为 VisitRecord 类的哈希值来源。

自界说完 hash 设施后， VisitRecord 实例就不错正常的被放入逼近中了。但这还不够，为了让前边提到的求差值算法正常使命，咱们还需要扫尾 eq 特殊设施。

eq 是 Python 在判断两个对象是否终点时调用的特殊设施。默许情况下，它只消在我方和另一个对象的内存地址王人备一致时，才会复返 True。关联词在这里，咱们复用了 VisitRecord 对象的哈希值，当二者终点时，就觉得它们一样。

完成了适合的数据建模后，之后的求差值运算便算是水到渠成了。新版块的函数只需要一排代码就能完成操作：

Hint：淌若你使用的是 Python 2，那么除了 eq 设施外，你还需要自界说类的 ne（判断连接顶时使用）设施。

使用 dataclass 简化代码

故事到这里并莫得扫尾。在上头的代码里，咱们手动界说了我方的数据类VisitRecord，扫尾了 __init__、 __eq__ 等运出动设施。但其实还有更节略的作念法。

因为界说数据类这种需求在 Python 中着实太常见了，是以在 3.7 版块中，圭臬库中新增了 dataclasses 模块，畸形帮你简化这类使命。

淌若使用 dataclasses 提供的特点，咱们的代码不错最终简化成底下这么：

无用干任何脏活累活，只消不到十行代码就完成了使命。

案例讲求

问题科罚以后，让咱们再作念极幼年小的讲求。在处理这个问题时，咱们一共使用了三种决策：

使用普通的两层轮回筛选相宜王法的阻挡集利用哈希表结构（set 对象）创建索引，培植处理成果将数据诊疗为自界说对象，利用王法，径直使用逼近运算

为什么第三种模样会比前边两种好呢？

领先，第一个决策的性能问题过于明显，是以很快就会被烧毁。那么第二个决策呢？仔细想想看，决策二其实并莫得什么明显的裂缝。致使和第三个决策比拟，因为少了自界说对象的进程，它在性能与内存占用上，致使有可能会微微强于后者。

但请再想考一下，淌若你把决策二的代码换成另外一种言语，比如 Java，它是不是基本不错作念到 1:1 的王人备翻译？换句话说，它天然成果高、代码径直，关联词它莫得王人备利用好 Python 天下提供的王法，最大化的从中受益。

淌若要具体化这个问题里的“王法”，那即是 “Python 领有内置结构逼近，逼近之间不错进行差值等四则运算” 这个事实自己。匹配王法后编写的决策三代码领有底下这些上风：

为数据建模后，不错更便捷的界说其他设施淌若需求变更，作念反向差值运算、求错乱运算都很节略调处逼近与 dataclasses 逻辑后，代码远比其他版块更精炼明晰淌若要修改终点王法，比如“只领有交流姓的纪录就作为一样”，只需要秉承 VisitRecord 阴事 __eq__ 设施即可

上一篇：游戏技巧与策略原神：克洛琳德最气象的声势出炉！双岩插件无需草神主打直伤！

下一篇：游戏技巧与策略封神幻思天下，掌抓这些，你将是别称出色的法师！

游戏技巧

明星新声与动态分享 青鸟高涨 Python妙手必读，作念一个忽闪王法的玩家

明星新声与动态分享青鸟高涨 Python妙手必读，作念一个忽闪王法的玩家