8天掌握EF的Code First开发之Entity Framework介绍 - tkb至简_H5之家

本篇目录 Entity Framework概要

Entity Framework是微软的Object Relational Mapper(对象关系映射器)，也就是我们平常说的ORM，它可以让应用程序开发者将关系型数据作为业务模型来使用，也消除了开发者为数据访问编写的绝大多数管道代码的需要(比如使用ADO.NET)。Entity Framework提供了一个综合的、基于模型的系统，通过摆脱为所有的领域模型编写相似的数据访问代码，使得开发者创建数据访问层是如此之简单。Entity Framework的首发版本是EF3.5，是伴随着.Net Framework 3.5 SP1和VS 2008 SP1一同发布的。从那之后，EF已经进化了很多很多，当前版本是6.1.3

Entity Framework通过开启数据访问和将数据表示为概念化模型（即一系列的实体类和关系）减轻了创建数据访问层的任务。应用程序可以执行基本的CRUD操作，以及轻松地管理实体间的一对一，一对多和多对多关系。

下面是使用Entity Framework的一些好处：

现在通过一张图看一下EF的架构：

从这张图上可以看到，EF是建立在ADO.NET框架之上的，它下面仍旧使用了ADO.NET方法和类来执行数据操作。

什么是ORM

几乎所有的商业软件都要存储数据，多年来，Relational Database Management System（RDBMS）一直是开发者寻求的数据存储。ORM是允许开发者使用面向对象的编程语言访问RDBMS数据的一系列技术。可用的RDBMS包括SQL Server, Oracle, DB2, MySQL等等。这些数据库系统有一些共性。每个数据库系统都支持一个或多个数据库。数据库都包含数据表，每个表都以表格的形式存储数据，并且被分成了列和行。多个表中的数据行可能相互关联。比如，一个订单Order表中的Id可能存储在一个流水表Transaction中。

过去，在像EF这样的工具出现之前，开发者都是在软件代码内部嵌套的sql语句，这是因为编程语言不能原生理解Sql。比如，要从数据库中检索数据，然后将结果作为对象操作，必须使用ADO.NET要写相当数量的代码才行。具体来说，先定义一个存储person的类，然后打开数据库连接，创建具有查询文本的命令，再执行该命令的reader，然后对该reader的结果进行迭代，最后再使用来自reader的数据填充Person类的实例。你会看到，这里包含了很多步骤，而且更重要的是，这样写的代码维护成本很高。比如，数据库中改了一个列名，这样还要去代码中进行相应更改，否则运行时就会抛出异常。此外，我们数据库中存储的是标量值数据（int,string等），但我们的目标是一个对象或者对象图。这样看来，这种访问数据的方式有很多问题。

首先，RDBMS的列类型和.Net类型之间有类型失配；其次，存储和目标之间也不匹配，前者是标量值的集合，后者是具有属性的对象。更糟糕的是，键入我们的person对象有一个更复杂的属性List Phones，该属性代表其他表的集合。这些问题在OOP和关系数据库中被称为“阻抗失配”（impedance mismatch）。

ORM这些工具出现的原因就是为了解决这种失配问题。ORM工具将存储在数据表中的数据表示为对象，这比起传统的代码有很多优势：
它们使用原生.net类型暴露数据，使用简单的属性暴露相关的数据，提供编译时检查。
最后，在后面会看到，你会写更少的代码。更少的代码意味着更少的bugs，不是吗？：）

Entity Framework简史

多年来，有许多ORM工具进入市场，有开源的，也有商业的。微软也开发了自己的ORM工具。第一个是内置于.Net 3.5的LINQ to SQL。该ORM仅支持
SQL Server和SQL Server Compact。2008年第一次发布的Entity Framework是第二次尝试，相较于LINQ to SQL有很多优点。首先，有自己的provider架构，因此对于所有的关系数据库引擎都是开放的，而不仅仅是SQL Server。现在所有的主要RDBMS都有Entity Framework provider。

Entity Framework经历了很多版本。
第一版只支持Database First。这意味着你要将设计器指向一个已存在的数据库，然后就会生成一个包含数据库和表抽象的代码。除了代码之外，还会创建一个EDMX文件，该XML文件包含了实体数据模型（因此你也就知道了EDMX的意思了Entity Data Model Xml）。它包括三个模型：逻辑，存储和映射。逻辑模型（有时也叫概念模型）就是使用C#进行编码的那个，存储模型描述了数据是如何存储到数据库中的，映射模型提供了逻辑模型和存储模型之间的映射。如果你在数据库中更改了东西，那么你也要更新生成的模型，C#代码也要再次生成。映射模型有一个基于ObjectContext的类，该类有数据库中每张表的集合属性，每个集合都是一个泛型集合，集合中的元素类型是从EF中的一个基类中继承的。每个类都有属性和相应的数据表中的列对应。
第二版，也就是EF4，也开始支持Model-First了。这样，我们就可以使用设计面板创建实体类，然后设计器会产成SQL脚本来生成数据库。对于这种方法，仍会生成EDMX文件，最终的结果是和Database First是相同的。
最后，EF的Code First在版本4.1中引入。Code First不需要EDMX文件了，每个实体也不需要从EF的基类中继承了。这样，代码变得更加容易测试。这种方法也不需要依赖设计器了，你只需要编写类就行，而且它们会自动地映射到数据库中的表。当前的EF 6.1.3中的Code First已经相当强大了。

Entity Framework具有的能力

EF对于微软开发者可以做很多事情。
首先，它可以将数据库暴露成对象的集合，这是通过利用很多关键的类完成的。前提是你要了解DbContext，这个类是EF Code First的核心，在高层次上是数据库抽象。数据库包含了表，每个表又包含了行和列。DbContext有泛型集合属性，每个属性的类型是DbSet<TRowType>对应于每个表。集合中的每个对象指的是一个实体，代表相应表中的一行。数据表中的列是定义在TRowType类中的属性。
一旦这个结构布局好了，那么你就能够通过LINQ查询来查询底层的数据库了。如果你将一个全新的TRowType类的实例添加到父集合中，然后使用DbContext API保存更改，那么这个新的对象就会变成相应表中的一行，该对象的每个属性的值就会变成该行相应的列值。此外，EF有能力表示其他的数据库工件，比如存储过程和函数。数据库结构的进化是很重要的一个问题，在大多数情况，随着应用程序的变化，你需要添加列和表，EF是通过Migration（迁移）功能来解决这个问题的。这个能力允许你通过C#代码更改数据库结构，除了添加和删除表和列之外，还可以添加索引。Migration可以没有数据损失地进化数据库模式。你将会看到，EF会暴露你需要使用C#访问的一切数据而不需要编写SQL，并且像对待你整个应用程序代码的一部分来对待数据库。你可以将migration代码迁入到源代码控制系统（Git/SVN）中，因为它也是C#代码！

Entity Framework的架构