數據結構-計算機系主頁_第1頁
已閱讀1頁,還剩104頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第六章 集合與字典,集合及其表示并查集與等價類字典散列,1,集合及其表示,集合是成員(元素)的一個群集。集合中的成員可以是原子(單元素),也可以是集合。集合的成員必須互不相同。在算法與數據結構中所遇到的集合,其單元素通常是整數、字符、字符串或指針,且同一集合中所有成員具有相同的數據類型。例:colour = { red, orange, yellow, green, black, blue, purple, white },

2、2,集合基本概念,集合中的成員一般是無序的,但在表示它時,常寫在一個序列里。常設定集合中的單元素具有線性有序關系,此關系可記作“<”,表示“優(yōu)先于”。整數、字符和字符串都有一個自然線性順序。指針也可依據其在序列中安排的位置給予一個線性順序。,3,集合(Set)的抽象數據類型,template class Set {public: virtual Set() = 0; //構造函數 virt

3、ual makeEmpty() = 0; //置空集合 virtual bool addMember (const T x) = 0;,4,,,,,,,,,,,,A?B 或 A+B A?B 或 A?B A-B,A,A,A,B,B,B,,,,,virtual bool delMember (const T x) = 0; virtual Set intersectWith (Se

4、t& R) = 0;//集合的交運算 virtual Set unionWith (Set& R) = 0; //集合的并運算 virtual Set differenceFrom (Set& R) = 0; //集合的差運算 virtual bool

5、 Contains (T x) = 0; virtual bool subSet (Set& R) = 0; virtual bool operator == (Set& R) = 0; //判集合是否相等};,5,用位向量實現集合抽象數據類型,當集合是全集合 { 0, 1, 2, …, n } 的一個子集,且 n 是不大的整數時,可用位(0,

6、1)向量來實現集合。當全集合是由有限個可枚舉的成員組成時,可建立全集合成員與整數 0, 1, 2, …的一一對應關系,用位向量來表示該集合的子集。一個二進位有兩個取值1或0,分別表示在集合與不在集合。如果采用16位無符號短整數數組bitVector[ ]作為集合的存儲,就要考慮如何求出元素 i 在bitVector數組中的相應位置。,6,集合的位向量(bit Vector)類的定義,#include #include const

7、 int DefaultSize = 50;template class bitSet {//用位向量來存儲集合元素, 集合元素的范圍在0到//setSize-1之間。數組采用16位無符號短整數實現public: bitSet (int sz = DefaultSize);//構造函數 bitSet (const bitSet& R);//復制構造函數 ~bitSet () { del

8、ete [ ]bitVector; }//析構函數 unsigned short getMember (const T x); //讀取集合元素x,7,void putMember (const T x, unsigned short v); //將值v送入集合元素x void makeEmpty () { //置空集合 for (int i = 0; i & operat

9、or = (const bitSet& R); bitSet& operator + (const bitSet& R); bitSet& operator * (const bitSet& R); bitSet& operator - (const bitSet& R); bool Contains (const T x);

10、 //判x是否集合this的成員,8,bool subSet (bitSet& R); //判this是否R的子集 bool operator == (bitSet& R); //判集合this與R相等 friend istream& operator >> (istream& in,

11、 bitSet& R); //輸入 friend ostream& operator & R); //輸出private: int setSize;//集合大小 int vectorSize;//位數組大小 unsigned short *bitVector; //存儲集合元素的位數組};

12、,9,使用示例,bitSet s1, s2, s3, s4, s5; bool index, equal; for (int k = 0; k < 10; k++) { //集合賦值 s1.addMember (k); s2.addMember(k+7);}//s1: {0, 1, 2, …, 9}, s2: {7, 8, 9, …, 16} s3 = s

13、1+s2; //求s1與s2的并 {0, 1, …, 16} s4 = s1*s2; //求s1與s2的交 {7, 8, 9} s5 = s1-s2; //求s1與s2的差 {0, 1, …, 6},10,//s1: {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} //s4: {7, 8, 9} index = s1.subSet (s4); //判斷s1是

14、否為s4子集 cout << index << endl; //結果,index = 0 equal = (s1 == s2); //集合s1與s2比較相等 cout << equal << endl; //為0, 兩集合不等,11,構造函數的實現,template bitSet::bitSet (int sz) : setSize

15、 (sz) { //構造函數 assert (setSize > 0); //檢查參數的合理性 vectorSize = (setSize+15) >> 4;//存儲數組大小 bitVector = new unsigned short[vectorSize];//分配空間 assert (bitVector != NULL);//檢查存儲分配是否成

16、功 for (int i = 0; i < vectorSize; i++) bitVector[i] = 0;//初始化};,12,template unsigned short bitSet:: getMember (const T x) { //讀取集合元素x,x從0開始 int ad = x/16; int id = x%16; unsi

17、gned short elem = bitVector[ad]; return ((elem >> (15 - id)) %2);};,13,template void bitSet:: putMember (const T x, unsigned short v) { //將值v送入集合元素x int ad = x/16; int id = x%16; unsigned

18、short elem = bitVector[ad]; unsigned short temp = elem >> (15-id); elem = elem > (id+1));};,14,templatebitSet& bitSet:: //求集合this與R的并operator + (const bitSet& R) {assert (vector

19、Size == R.vectorSize); bitSet temp (vectorSize);for (int i = 0; i < vectorSize; i++) temp.bitVector[i] = bitVector[i] | R.bitVector[i]; return temp; //按位求"或", 由第三個集合返回};,15,template

20、bitSet& bitSet:: //求集合this與R的交operator * (const bitSet& R) { assert (vectorSize == R.vectorSize); bitSet temp (setSize); for (int i = 0; i < vectorSize; i++) temp.bitV

21、ector[i] = bitVector[i] & R.bitVector[i]; return temp; //按位求“與”, 由temp返回};,16,template bitSet& bitSet:://求集合this與R的差operator - (const bitSet& R) { assert (vectorSize == R.vectorSize); bitS

22、et temp (setSize); for (int i = 0; i < vectorSize; i++) temp.bitVector[i] = bitVector[i] & (~R.bitVector[i]); return temp;//由第三個集合返回};,17,18,集合的并,集合的交,集合的差,template bool bitSet::subSet (bi

23、tSet& R) {//判this是否R的子集 assert (setSize == R.setSize); for (int i = 0; i < vectorSize; i++) //按位判斷 if (bitVector[i] & (~R.bitVector[i])) return false;return true;};,19,template boo

24、l bitSet::operator == (bitSet& R) {//判集合this與R相等 if (vectorSize != R.vectorSize) return false; for (int i = 0; i < vectorSize; i++) if (bitVector[i] != R.bitVector[i]) return false;

25、 return true;//對應位全部相等};,20,用有序鏈表實現集合抽象數據類型,用有序鏈表來表示集合時,鏈表中的每個結點表示集合的一個成員。各結點所表示的成員 e0, e1, …, en 在鏈表中按升序排列,即 e0 < e1 < … < en。集合成員可以無限增加。因此,用有序鏈表可以表示無窮全集合的子集。,21,用帶表頭結點的有序鏈表表示集合,,last,,last,集合的有序鏈表類的

26、定義,template struct SetNode {//集合的結點類定義 T data;//每個成員的數據 SetNode *link;//鏈接指針 SetNode() : link (NULL);//構造函數 SetNode (const T& x, SetNode *next = NULL) : data (x), link (next);

27、//構造函數};,22,template class LinkedSet {//集合的類定義 private: SetNode *first, *last; //有序鏈表表頭指針, 表尾指針 public: LinkedSet () { first = last = new SetNode; } LinkedSet (LinkedS

28、et& R);//復制構造函數 ~LinkedSet () { makeEmpty(); delete first; } void makeEmpty();//置空集合 bool addMember (const T& x); bool delMember (const T& x); LinkedSet& ope

29、rator = (LinkedSet& R); LinkedSet& operator + (LinkedSet& R);,23,LinkedSet& operator * (LinkedSet& R); LinkedSet& operator - (LinkedSet& R); bool Contains (const T x);//判x是否

30、集合的成員 bool operator == (LinkedSet& R);//判集合this與R相等 bool Min (T& x);//返回集合最小元素的值 bool Max (T& x);//返回集合最大元素的值 bool subSet (LinkedSet& R); //判this是否R的子集};,24,表示集合的幾個重載

31、函數,template LinkedSet& LinkedSet::operator + (LinkedSet& R) {//求集合this與集合R的并,25,SetNode *pb = R.first->link;//R掃描指針 SetNode *pa = first->link;//this掃描指針 LinkedSet temp;//創(chuàng)建空鏈表 SetNod

32、e *p, *pc = temp.first;//結果存放指針 while (pa != NULL && pb != NULL) { if (pa->data == pb->data) {//兩集合共有 pc->link = new SetNode(pa->data); pa = pa->link;

33、 pb = pb->link; } else if (pa->data data) {//this元素值小 pc->link = new SetNode(pa->data); pa = pa->link; },26,else {//R集合元素值小

34、pc->link = new SetNode(pb->data); pb = pb->link; }pc = pc->link; } if (pa != NULL) p = pa;//this集合未掃完 else p = pb;//或R集合未掃完 while (p != NULL) {//向結果鏈逐個復制

35、 pc->link = new SetNode(p->data); pc = pc->link; p = p->link; } pc->link = NULL; temp.last = pc; //鏈表收尾 return temp;};,27,等價類與并查集,在求解實際應用問題時常會遇到等價類問題。從數學上看,等價類是

36、對象(或成員)的集合,在此集合中所有對象應滿足等價關系。若用符號“?”表示集合上的等價關系,則對于該集合中的任意對象x, y, z,下列性質成立:自反性:x ? x (即等于自身)。對稱性:若 x ? y, 則 y ? x。傳遞性:若 x ? y且 y ? z, 則 x ? z。,28,等價關系與等價類(Equivalence Class),因此,等價關系是集合上的一個自反、對稱、傳遞的關系。“相等”(=)就是一種等價關系,

37、它滿足上述的三個特性。一個集合 S 中的所有對象可以通過等價關系劃分為若干個互不相交的子集 S1, S2, S3, …,它們的并就是 S。這些子集即為等價類。,29,確定等價類的方法,確定等價類的方法分兩步走:讀入并存儲所有的等價對( i, j );標記和輸出所有的等價類。,30,,,,給定集合 S = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 },及如下等價對: 0 ? 4, 3 ?

38、 1, 6 ? 10, 8 ? 9, 7 ? 4, 6 ? 8, 3 ? 5, 2 ? 11, 11 ? 0進行歸并的過程為:初始{0},{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11}0 ? 4 {0,4},{1},{2},{3},{5},{6},{7},{8},{9},{10},{11}3 ? 1 {0,4},{1,3},{2},{5},{6},{7},{8},{9},{

39、10},{11}6 ? 10 {0,4},{1,3},{2},{5},{6,10},{7},{8},{9},{11}8 ? 9 {0,4},{1,3},{2},{5},{6,10},{7},{8,9},{11}7 ? 4 {0,4,7},{1,3},{2},{5},{6,10},{8,9},{11},31,{0,4,7},{1,3},{2},{5},{6,10},{8,9},{11}6 ? 8 {0,4,7},{1,3}

40、,{2},{5},{6,8,9,10},{11}3 ? 5 {0,4,7},{1,3,5},{2},{6,8,9,10},{11}2 ? 11 {0,4,7},{1,3,5},{2,11},{6,8,9,10}11 ? 0 {0,2,4,7,11},{1,3,5},{6,8,9,10},32,并查集 (Union-Find Sets),并查集支持以下三種操作: Union (Root1, Root2) //合并操作 F

41、ind (x) //查找操作 UFSets (s) //構造函數對于并查集來說,每個集合用一棵樹表示。為此,采用樹的雙親表示作為集合存儲表示。集合元素的編號從0到 n-1。其中 n 是最大元素個數。,33,在雙親表示中,第 i 個數組元素下標代表包含集合元素 i 的樹結點。根結點的雙親為 -k,表示集合中的元素個數為k。同一棵樹上所有結點

42、所代表的集合元素在同一個子集合中。為此,需要有兩個映射:集合元素到存放該元素名的樹結點間的對應;集合名到表示該集合的樹的根結點間的對應。,34,設 S1= {0, 6, 7, 8}, S2= {1, 4, 9}, S3= {2, 3, 5},35,為簡化討論,忽略實際的集合名,僅用表示集合的樹的根來標識集合。,36,S1,下標parent,集合 S1, S2 和 S3 的雙親表示,-4 4 -3 2 -3

43、 2 0 0 0 4,,,,,,,,,0 1 2 3 4 5 6 7 8 9,,S2,S3,,,,,,,,,,,,,,,,,,,,,,37,初始時, 用構造函數 UFSets(s) 構造一個森林, 每棵樹只有一個結點, 表示集合中各元素自成一個子集合。用 Find(i) 尋找集合元素 i 的根。如果有兩個集合元素

44、 i 和 j, Find(i) == Find(j), 表明這兩個元素在同一個集合中,如果兩個集合元素 i 和 j 不在同一個集合中,可用 Union(i, j) 將它們合并到一個集合中。,38,,S1 ? S2的可能的表示方法,下標parent,集合 S1 ? S2 和 S3 的雙親表示,-7 4 -3 2 0 2 0 0 0 4,,,,,,,,,0 1

45、 2 3 4 5 6 7 8 9,,,,,,,,,,,,,,,0,4,6,7,8,4,1,9,0,1,9,6,7,8,用雙親表示實現并查集的類定義,const int DefaultSize = 10;class UFSets {//集合中的各個子集合互不相交public: UFSets (int sz = DefaultSize);//構造函數

46、~UFSets() { delete []parent; }//析構函數 UFSets& operator = (UFSets& R); //集合賦值 void Union (int Root1, int Root2); //子集合并 int Find (int x);//查找x的根 void WeightedUnion (int Root1, int R

47、oot2);//改進例程:加權的合并算法private:,39,int *parent; //集合元素數組(雙親表示) int size; //集合元素的數目};UFSets::UFSets (int sz) {//構造函數:sz 是集合元素個數,雙親數組的范圍//為parent[0]~parent[size-1]。 size = sz; //集合元素個數 pare

48、nt = new int[size]; //創(chuàng)建雙親數組 for (int i = 0; i < size; i++) parent[i] = -1; //每個自成單元素集合};,40,并查集操作的算法 查找,41,-5,,1,,2,,3,,4,0,1,2,3,4,,parent (4),,parent (3) =

49、 3,,parent (2) =2,,parent (1) = 1,,parent (0) = 0,= -5 < 0 結束,int UFSets::Find (int x) {//函數搜索并返回包含元素x的樹的根。 if (parent[x] < 0) return x; //根的parent[]值小于0 else return (Find (parent[x]

50、));};,42,void UFSets::Union (int Root1, int Root2) {//求兩個不相交集合Root1與Root2的并 parent[Root1] += parent[Root2]; parent[Root2] = Root1; //將Root2連接到Root1下面};Find 和 Union 操作性能不好。假設最初 n 個元素構成

51、n 棵樹組成的森林,parent[i] = -1。做處理Union(n-2, n-1), …, Union(1, 2), Union(0, 1)后,將產生退化的樹。,43,合并,44,,1,0,2,3,4,2,0,1,4,2,4,4,3,3,Union(0,1),3,4,1,2,3,,,,,,,,Union(1,2),,,Union(2,3),,Union(3,4),,,,,45,執(zhí)行一次Union操作所需時間是 O(1),n-1次Un

52、ion操作所需時間是O(n)。若再執(zhí)行Find(0), Find(1), …, Find(n-1), 若被搜索的元素為 i,完成 Find(i) 操作需要時間為O(i+1),完成 n 次搜索需要的總時間將達到 改進的方法 按樹的結點個數合并 按樹的高度合并 壓縮元素的路徑長度,,按樹結點個數合并結點個數多的樹的根結點作根,46,1,0,2,3,4,5,6,5,2,0,2,0,1,3,4,6,,,,,3,,4,6,,,5,

53、,,1,,,Union(2, 0),,void UFSets :: WeightedUnion (int Root1, int Root2) {//按Union的加權規(guī)則改進的算法 int temp = parent[Root1] + parent[Root2]; if (parent[Root2] < parent[Root1]) { parent[Root1] = Root2;

54、 //Root2中結點數多 parent[Root2] = temp; //Root1指向Root2 } else { parent[Root2] = Root1; //Root1中結點數多 parent[Root1] = temp; //Root2指向Root1 }};,47,按樹高度合并 高度高的樹的根結點作根,48,1,

55、0,2,3,4,5,6,5,2,0,2,0,1,3,4,6,,,,,3,,4,6,,,5,,,1,,,Union(2, 0),,49,壓縮元素的路徑長度,3,0,1,9,,,,,5,,,6,7,8,,,,,3,0,1,9,,,,,5,,6,7,8,,,,,3,0,1,9,,,,,5,,6,7,8,,,字典(Dictionary),字典是一些元素的集合,每個元素有一個稱作關鍵碼(key)的域,不同元素的關鍵碼互不相同。 文件(File)

56、 表格(Table)在討論字典抽象數據類型時,把字典定義為對的集合。根據問題的不同,可以為名字和屬性賦予不同的含義。,50,例如,在圖書館檢索目錄中,名字是書名,屬性是索書號及作者等信息;在計算機活動文件表中,名字是文件名,屬性是文件地址、大小等信息。一般來說,有關字典的操作有如下幾種:確定一個指定的名字是否在字典中;搜索出該名字的屬性;修改該名字的屬性;插入一個新的名字及其屬性;刪除一個名字及其屬性。,51,字典的抽

57、象數據類型,const int DefaultSize = 26;template class Dictionary {//對象: 一組對, 其中, 名字是唯一的public: Dictionary (int size = DefaultSize); //構造函數 bool Member (Name name);//判name是否在字典中 Attribute *Search (Nam

58、e name); //在字典中搜索關鍵碼與name匹配的表項,52,void Insert (Name name, Attribute attr); //若name在字典中, 則修改相應對 //的attr項; 否則插入到字典中 void Remove (Name name); //若name在字典中, 則在字典中刪除相應的 //對};用文件記錄(r

59、ecord)或表格的表項(entry)來表示單個元素時,用:(關鍵碼key,記錄或表項位置指針adr) 構成搜索某一指定記錄或表項的索引項。,53,字典的線性表描述,字典可以保存在線性序列 (e1,e2,…) 中,其中ei 是字典中的元素,其關鍵碼從左到右依次增大。為了適應這種描述方式,可以定義有序順序表和有序鏈表。用有序鏈表來表示字典時,鏈表中的每個結點表示字典中的一個元素,各個結點按照結點中保存的數據值非遞減鏈接,即

60、e1≤e2 ≤ …。因此,在一個有序鏈表中尋找一個指定元素時,一般不用搜索整個鏈表。,54,有序順序表的類定義,#include #include “SeqList.h”const int defaultSize = 50;template class SortedList : public SeqList {public: int Search (K k1) const; //搜索 voi

61、d Insert (const K k1, E& e1); //插入 bool Remove (const K k1, E& e1); //刪除};,55,基于有序順序表的順序搜索算法,template int SortedList::Search (K k1) const {//順序搜索關鍵碼為k1的數據對象 int n = last+1; for (int i

62、 = 1; i k1) break; return 0; //順序搜索失敗, 返回失敗信息};算法中的“==”和“>”都是重載函數,在定義K時定義它們的實現。,56,有序順序表順序搜索的時間代價,衡量一個搜索算法的時間效率的標準是:在搜索過程中關鍵碼平均比較次數,也稱為平均搜索長度ASL (Average Search Length),通常它是字典中元素總數 n 的函數。設搜索第 i 個元素的概率

63、為 pi, 搜索到第 i 個元素所需比較次數為 ci, 則搜索成功的平均搜索長度:,57,在順序搜索情形,搜索第 i (1≤i≤n) 個元素需要比較 i 次,假定按等概率搜索各元素:這與一般順序表情形相同。但搜索不成功時不需一直比較到表尾,只要發(fā)現下一個元素的值比給定值大,就可斷定搜索不成功。設一個有 n 個表項的表,查找失敗的位置有n+1個,可以用判定樹加以描述。搜索成功時停在內結點,搜索失敗時停在外結點。,58,例如,有

64、序順序表 (10, 20, 30, 40, 50, 60)的順序搜索的分析(使用判定樹),59,判定樹是一種擴充二叉樹。內結點代表順序表中已有的元素,外結點代表失敗結點,它表示在兩個相鄰已有元素值之間的值。假定表中所有失敗位置的搜索概率相同,則搜索不成功的平均搜索長度:時間代價為O(n)。為了加速搜索,在有序順序表的情形,可以采用折半搜索,它也稱二分搜索,時間代價可減小到O(log2n)。,60,基于有序順序表的折半搜索,設 n

65、 個元素存放在一個有序順序表中。折半搜索時, 先求位于搜索區(qū)間正中的元素的下標mid,用其關鍵碼與給定值 x 比較: data[mid].key == x,搜索成功; data[mid].key > x,把搜索區(qū)間縮小到表的前半部分,繼續(xù)折半搜索; data[mid].key < x,把搜索區(qū)間縮小到表的后半部分,繼續(xù)折半搜索。如果搜索區(qū)間已縮小到一個對象,仍未找到想要搜索的對象,則搜索失敗。,61,62,63,6

66、4,templateint SortedList::BinarySearch (K k1, const int low, const int high ) const {//折半搜索的遞歸算法,用到E的重載操作“” int mid = 0; //元素序號從0開始 if (low k1) mid = BinarySearch (k1, low, mid -

67、1); else return mid; } return 0;};,65,template int SortedList ::BinarySearch (K k1) const { //折半搜索的迭代算法,用到K的重載操作“” int high = n-1, low = 0, mid; //元素序號從0開始 while (low

68、 k1) high = mid-1; //左縮搜索區(qū)間 else return mid; //搜索成功 } return 0; //搜索失敗},分析有序順序表 ( 10, 20, 30,

69、40, 50, 60 ) 的折半搜索算法性能的判定樹:,66,10,50,,,,,,,,=,=,=,=,=,=,,,30,,,,,,,,<,<,<,<,<,<,>,>,>,>,>,>,,,,20,40,60,ASLunsucc = (2*1+3*6)/7 = 20/7,ASLsucc = (1+2*2+ 3*3)/6 = 14/

70、6,判定樹也是擴充二叉樹,搜索成功時檢測指針停留在樹中某個內結點上。搜索不成功時檢測指針停留在某個外結點(失敗結點)上。,67,,,,,,,,,,,,,,,,,35,15,45,50,25,10,20,30,,,,,,,,,,,,,,搜索22,搜索45,,折半搜索算法的性能分析,若設 n = 2h-1,則描述折半搜索的判定樹是高度為 h 的滿二叉樹 (加上失敗結點高度為h +1)。 2h = n+1, h =

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論