将数据库访问集成到 Linux 应用中

将数据库访问集成到 Linux 应用中

为什么使用独立数据库?
MySQL 数据库
MySQL API
安全性
参考资料
关于作者
对本文的评价


本文描述了 MySQL,一种利用第三方数据库开发电子贸易和其它复杂、动态网站的有效工具。MySQL 是一种快速、多线程和全功能的 SQL 服务器。除了描述 MySQL 系统的基本体系结构以外,本文还提供了以 Tcl 和 C++ 编写的简单示例,帮助您开发支持数据库的 Web 应用。
一个必须存储或访问大量信息的应用程序可以从使用第三方数据库产品中受益匪浅。在对信息的访问必须在程序的多个实例上进行时更是如此。基于 Web 的应用(包括电子贸易)就是它的良好例证。

为什么使用独立数据库?
Web 服务器必须使其处理脚本有办法来存储有关供其以后访问的状态信息。尽管有可能使用比较原始一些的方法 -- 例如转储到文本文件或开发自制的迷你数据库 -- 但只有成熟的数据库应用才能提供更为复杂的 Web 应用所需的所有服务。因为有一些免费获得的软件包可用于该目的,所以编写定制的特定于应用的数据库引擎并无太大好处。另外,使用第三方数据库还使 Web 开发者不必投入到开发和维护数据库的任务中。

MySQL 数据库
通过使用脚本语言和编译型系统语言(例如 C),将数据库集成到 Linux 应用就可能相当容易。可免费获得的 MySQL(在 GNU Public License 下发行)数据库提供了一系列复杂的 SQL 功能,并易于集成到应用中。MySQL 是快速、多线程的,并支持 ANSI 和 ODBC SQL 标准。加上第三方软件,MySQL 就支持用于事务处理应用的事务安全的表。

什么是事务处理?
事务是需要以原子方式执行的对数据库所做的一系列更改。它们要么必须全部执行,要么一个都不执行。例如,在 Web 上销售产品时所有必需的数据库更改组成一个事务。数据库需要同时减去客户帐户余额和产品库存,否则失败并且一个操作都不执行。

无论服务器出于何种原因发生崩溃都不应该引起事务被部分执行。例如帐单多算、产品没有交付,或者库存不实等都有可能是部分完成的事务的结果。

支持事务处理的数据库可以将一组数据库代码封装在一个事务中,在事务执行期间的任何失败会让数据库回滚到事务开始之前的状态。

这是通过维护所有数据库操作的日志,以及其原始状态表的副本来实现的,在失败后下一次重新启动服务器时允许回滚操作。这种时间和空间上的开销是事务安全数据库系统所必需的一种折衷。

单一 MySQL 服务器控制着一系列数据库,它们都可以通过服务器以类似方式来访问。每个数据库实际上都是一组任意数量的表,概念与其它 SQL 数据库的用户类似。每个表都由带类型的数据列组成。数据可以是整数、实数值、字符串或其它类型,包括原始二进制流。表中的每一行都是存储在数据库中的一个记录。

MySQL 被设计和构造成客户机/服务器。服务器 mysqld 可以在能从因特网访问到的任何机器上运行(最好与 Web 服务器在同一台或最接近的一台机器上,以确保合理的响应时间)。 MySQL 客户机使用请求来与 MySQL 服务器联系,修改或查询服务器所拥有的数据库。在支持数据库的 Web 应用程序中,数据库客户机是 Web 服务器或由 Web 服务器产生的 CGI 脚本。这些客户机可以用高级脚本语言或低级系统语言编写,只要存在这种语言的数据库 API 即可。在 Linux 中,大多数脚本语言是以 C 实现的,因为存在 MySQL C API,所以要将 MySQL 支持添加到任何现有的脚本语言或工具应该很容易。绝大部分脚本语言已经完成了这一步。

MySQL API
MySQL API 可用于各种语言,包括几乎所有编写网站后端所实际使用的语言。使用这些 API,我们可以构建由 Web 服务器控制的 MySQL 客户机。

API(用于数据库访问)以基于连接的模式工作。客户机必须做的第一件事是打开与 MySQL 服务器的连接。这包括适当地使用服务器认识的用户名和口令来对连接进行身份认证。建立了连接后,服务器选择要使用的特定数据库。确定了初始化后,客户机应用程序(就我们来说是服务器方 CGI 脚本)就能自由地与数据库以两种方式中的一种进行交互:可以运行常规 SQL 命令,包括添加和删除表,以及向它们添加记录;也可以对返回结果的数据库运行查询。查询生成一组与查询匹配的记录,然后,客户机可以逐一访问记录,直到查看完所有记录,或者客户机取消暂挂的记录检索。一旦脚本完成了对数据库的操作后,与服务器的连接就被关闭。

要构建集成数据库访问的网站,需要编写 CGI 脚本来根据数据库状态生成动态结果。Web 服务器启动 CGI 脚本,然后将适当格式化的 HTML 输出到它们的标准输出流中。Web 服务器捕捉到 HTML 后将它发送回客户机,如同请求是对静态 HTML 页面进行的那样。在生成 HTML 的过程中,脚本可以修改数据库,也可以查询并将结果合并到它们的输出中。

作为简单解释上述过程的一个示例,下面的代码(以 C 和 Tcl 编写)查询一个包含某公司供销售的产品清单的数据库。这绝没有使用两种语言 MySQL API 的所有特性,但提供了快速、简易扩展的示例,可以对数据库内容执行任何 SQL 命令。在该例中,脚本显示了低于特定价格的所有产品。在实践中,用户可能在 Web 浏览器中输入该价格,然后将它发给服务器。我们省去了从环境变量中进行读取来确定 HTML 表单值的细节,因为它与不支持数据库的 CGI 脚本中执行的情况没有什么差别。为清晰起见,我们假设事先设置了特定一些参数(例如要查询的价格)。

以下代码是使用免费获得的 Tcl Generic Database Interface 以 Tcl 实现的。这样一种接口的好处在于 Tcl 是解释型的,可以对代码进行迅速开发和快速修改。

Tcl 示例
#This code prints out all products in the database
# that are below a specified price (assumed to have been determined
# beforehand, and stored in the variable targetPrice)
# The output is in HTML table format, appropriate for CGI output

#load the SQL shared object library. the Tcl interpreter could also
#have been compiled with the library, making this line unnecessary
load /home/aroetter/tcl-sql/sql.so

#these are well defined beforehand, or they could
#be passed into the script
set DBNAME "clientWebSite";
set TBLNAME "products";
set DBHOST "backend.company.com"
set DBUSER "mysqluser"
set DBPASSWD "abigsecret"

set targetPrice 200;

#connect to the database
set handle [sql connect $DBHOST $DBUSER $DBPASSWD]
sql selectdb $handle $DBNAME ;# get test database

#run a query using the specified sql code
sql query $handle "select * from $TBLNAME where price <= $targetPrice"


#print out html table header
puts ""
puts " Product Id Description Price ($)"

#output table rows - each fetchrow retrieves one result
#from the sql query
while {[set row [sql fetchrow $handle]] != ""} {
set prodid [lindex $row 0]
set descrip [lindex $row 1]
set price [lindex $row 2]
puts "
$prodid $descrip $price"
}

puts "
"

#empty the query result buffer - should already be empty in this case
sql endquery $handle
#close the db connection - in practice this same connection
#is used for multiple queries
sql disconnect $handle




下面的代码是使用正式 MySQL C++ API MySQL++ 以 C++ 编写的等价脚本。该版本的优势在于它是编译型的,因此比解释语言更快。经常用在特定站点的数据库代码应该以 C 或 C++ 编写,然后由脚本或直接由 Web 服务器访问,以改进整体运行时间。

C++ 示例
#include
#include
#include

const char *DBNAME = "clientWebSite";
const char *DBTABLE = "products";
const char *DBHOST = "backend.company.com";
const char *DBUSER = "mysqluser";
const char *DBPASSWD = "abigsecret":

int main() {
try {
//open the database connection and query
Connection con(DBNAME, DBHOST, DBUSER, DBPASSWD);
Query query = con.query();

//write valid sql code to the query object
query << "select * from " << DBTABLE;

//run the query and store the results
Result res = query.store();

//write out the html table header
cout << "n";
cout << " Product Id Description"
<< " Price ($)" << endl;

Result::iterator curResult;
Row row;

//iterate over each result and put it into an html table
for (curResult = res.begin(); curResult != res.end(); curResult++) {
row = *curResult;
cout << "
" << row[0]
<< " " << row[1]
<< " " << row[2] << endl;

}
cout << "
" << endl;

} catch (BadQuery er) {
// handle a bad query (usually caused by a sql syntax error)
cerr << "Error: " << er.error << endl;
return -1;

} catch (BadConversion er) {
//handle conversion errors out of the database as well
cerr << "Error: Can't convert "" << er.data << "" to a ""
<< er.type_name << ""." << endl;
return -1;
}
return 0;
}



安全性
在 Web 上创建以 Web 支持的应用有一些开发者需要考虑的问题。所有有关 Web 服务器上 CGI 程序的问题,例如 Web 服务器处理许可权和脚本方的输入检查,也仍然需要考虑。除此之外,维护数据库系统的安全性也很有必要。这涉及保护数据库服务器的许可权系统,以及使从数据库客户机到服务器的连接安全。

MySQL 提供了深入的安全性系统,有人形容它是“高级但不标准”。MySQL 允许根据用户名、客户机主机和要访问的数据库对客户机进行访问。要创建安全的系统,让所有用户使用强口令,不要给他们任何他们不是绝对需要的访问权。这包括表面上无害的特权,例如可以让用户查看所有正在运行的进程(包括更改其他用户口令的那些)的处理特权。最好的办法是以无特权的 Unix 用户运行服务器进程本身,这样如果一个数据库被泄露,也不至于击垮整个系统。这与以用户 nobody 而非 root 用户运行 httpd 类似。描述系统访问的表是作为单独的 MySQL 数据库存储的,可以由 MySQL root 用户更新。请注意,MySQL 服务器根据 MySQL 用户名授予特权,这些用户名与 Unix 用户名不同。不过,有一个 MySQL root 用户名,它对数据库有全部权限。一旦服务器确定了连接客户机是谁,以及它们在尝试连接什么之后,就根据给定的一组权限来控制访问权。要防止访问表中主机名被 DNS 电子欺骗,可以输入所有主机的 IP 地址,或请求服务器将 IP 地址解析回原始主机名来使其他人截获 DNS 请求和回答更困难。

除了服务器访问表以外,与服务器的通信也必须很安全。从客户机登录到服务器上时,口令不以纯文本方式发送;不过所有后续 SQL 命令将以纯文本方式发送。为达到更高的安全性,使用 ssh 来设置端口转发。它将服务器和客户机之间的所有通信进行加密,防止有人在传输中观察它。来自客户机的数据发送到客户机本地机器中本地 ssh 服务器所侦听的端口上。它由本地 ssh 服务器使用,加密后发送给远程 ssh 服务器,由它进行解密并转发到 MySQL 服务器端口。

在实际中,最安全的方法是在 Web 服务器所在的机器上运行数据库服务器,并让由 Web 服务器产生的 CGI 脚本通过 UNIX(本地)套接字与 MySQL 服务器进行通信。该设置可以让数据库管理员禁用所有与 MySQL 服务器的远程连接。如果 Web 和数据库服务器必须位于不同的机器上,加密它们之间的所有通信,或者将两台机器通过其自己专用的、物理上隔离的网络连接。只创建一个由 Web 服务器使用的用户帐户(除 root 用户外)以登录到数据库服务器。

由数据库驱动的网站是一些功能强大的工具,可以让开发者创建提供更新信息的动态站点,并让由客户机发起的更改在多个会话之间持续。后端数据库的使用对于管理电子贸易和其它应用的用户来说必不可少。通过使用可免费获得的软件,有可能建立由数据库驱动的站点,安全地将数据库连通性集成到站点现有的 CGI 体系结构中。

参考资料

有关最新新闻和文章,请访问 MySQL 主页。
在 MySQL++ 上查找 C++ 与 MySQL 的正式接口。
Tcl GDBI(Generic Database Interface)是用在本文中 Tcl 示例中的 Tcl MySQL API。
详细了解用于加密 MySQL 客户机和服务器之间所有通信的 Secure Shell (ssh)。它用在不可信网络(例如公共因特网任意部分)上进行的通信中。
支持
领教
学习了
强烈支持