超级计算机囧囧囧's Archivers

From admin on 2012-11-08 16:21:45

EAV模型(三)(Entity-Attribute-Value,实体-属性-值)

示例(Example

EAV的最简单实现可能只有三个表:实体,属性和值。如此设置的示例如下所示:

<img class="aligncenter size-full wp-image-1346" title="EAV模型" src="http://www.sunhaibing.com/wp-content/uploads/2012/11/16162.png" alt="" width="480" height="236" />


然而,在这种实现中,缺失了元数据信息,不论何种数据类型,所有的值都存为varchar。作为对这一方法的衍生,可以另外选择一个强类型的实现方法,其中一个给定数据类型的值存储为特定类型表的数据记录。下述模式(schema)例子所示,其中包括元数据信息,如前文所讨论。

<img class="aligncenter size-full wp-image-1347" title="EAV模型" src="http://www.sunhaibing.com/wp-content/uploads/2012/11/16163.png" alt="" width="538" height="374" />


Magento采用EAV模型(Magento  Uses The EAV Model

在开源和php社区,最著名的EAV实现是Magento,一个电子商务平台。首先来看看Magento的数据库模式(Magento database schema)。虽然一开始显得复杂,我们逐步来浏览。

正如之前提到的,实体可以是任何条目或事件。Magento中包含多个实体,例如:客户,订单,发票和产品。出于本文的目的,将用产品实体来解释EAV的实现。产品的主表为catalog_product_entity。但是,您可能会感到惊讶,只保存了几类的信息,如实体类型,型号(SKU)以及产品创建时间。

为建立一个完整的产品记录,需要找到它的属性,然后找到每一属性的值。在catalog_product_entity表中,会发现entity_type_id列,用来在整个数据库中标识实体的类型。基于实体的类型,可以通过查找eav_attribute来找到要设置产品的那一属性。此表记录了Magento所有实体的全部属性,也包含每一记录的元信息,如数据类型、前端细节等;就产品而言,实体类型ID设置为4(类型在eav_entity_type表中列出),查询欲设置的所有产品属性,简单操作如下:
SELECT*FROMeav_attribute WHEREentity_type_id =4;
属性的名称被记录为attribute_code,元数据信息中,一个重要的列为backend_type,这表明一属性为何种数据类型,该属性的值存在何处。Magento的允许下列数据类型:



正如前面所述,值可以基于其数据类型存储在多个表中。检查一特定属性,可以使用如下查询:
SELECT*FROMeav_attribute WHEREentity_type_id =4ANDattribute_code ='name';
上述查询运行后,可以看到,属性“name”的数据类型为varchar,产品属性的值跨多个表存储:

catalog_product_entity_datetime, catalog_product_entity_decimal, catalog_product_entity_int, catalog_product_entity_text, catalog_product_entity_varchar。这些表说明了EAV模型中不同数据类型的存储方式。

为获得所有的产品,可使用的查询列表如下:
SELECT cpe.entity_id,value ASname FROM catalog_product_entity cpe

INNER JOINeav_attribute ea ON cpe.entity_type_id =ea.entity_type_id

INNER JOINcatalog_product_entity_varchar cpev ON ea.attribute_id =cpev.attribute_id AND cpe.entity_id =cpev.entity_id

WHERE ea.attribute_code ='name'
这个概念很简单,一旦你知道从哪里开始以及如何查找表中的下一个层次。所有其他实体遵循同样的原则:对于感兴趣的对象先找到实体类型ID,然后基于该ID从eav_attribute中获得所有属性,最后,基于属性的数据类型,从不同的表中查询每一属性的值。

EAV模型的优/缺点(Advantages and Disadvantages of the EAV Model

EAV模型的主要优点是其灵活性。属性描述表不限制列的数量,这意味着每次新增属性不需要重新设计数据结构(schema);扩展数据库时,属性的数量可以垂直增加(每一新的参数在表中为一的记录),而无需改变数据结构。

事实上,EAV只处理非空属性意味着不需要为空值保留额外的存储空间。这使得EAV模型相当节省空间。

物理数据格式是非常干净,类似于XML,很容易将数据映射为XML格式,只需替换要开始和结束属性标签。

EAV模型可以极好地迅速扩展应用,因为它可以防止(属性)不断变化的后果。可以简单地记录任何结构的新数据,而不需要修改任何数据结构。

当考虑EAV时,确定数据是否稀疏和量大恒重要,因为采用不恰当的数据集时,EAV设计的复杂性超过了其优势所在。相对静态或简单数据选用传统的表结构更为合适。

相较于传统的数据结构,EAV的一个主要缺点是它在检索大容量数据时效率较低。在EAV模型中,数据更加分散,所以查询(select)一个完整实体的记录需要多个表连接。更重要的是,当EAV模型应用于大数据量时,对于同一组EAV建模的数据描述,需要短暂或永久地在列(column)和行之间进行转换。该操作易于出错且是CPU密集型的任务。

EAV模型的另一个局限性,需要制定额外的逻辑来完成传统数据结构(/模式)下自动进行的述务。但是,利用现有的EAV工具可以降低此类工作的成本。

最后,理解EAV模型确实需要时间。它有一个明确的学习曲线,使的初级开发人员在真正理解其概念前,需要为此付出更多的精力。

结论(Conclusion

应用实体-属性-值时,应考虑以下条件:

在生产环境中,往往采用混合模式(mixed schema),包括传统的关系、EAV或合适的混合方法。但是,EAV建模,需要引入元数据来获取EAV的逻辑模型数据。我们看到Magento,受EAV影响很大,其中各种不同的产品将有很不同的属性集,是一个运用该模型的非常有效的好例证。本文希望揭示什么是EAV模型,以及如何、何时应用它才更重要。如果您有更多应用EAV模型的例子,或有任何疑问,请作评论!

英文原文: http://techportal.ibuildings.com/2010/10/21/the-eav-data-model/

查看完整版本: EAV模型(三)(Entity-Attribute-Value,实体-属性-值)

Tags: EAV


©超级计算机囧囧囧