国外色视频在线观看,成人超碰在线免费观看,亚洲Av综合色区无专区

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案

計劃將Elasticsearch引入系統(tǒng)架構，領導卻死活不同意……

?前言

我曾經(jīng)面試安踏的技術崗，當時面試官問了我一個問題：如果你想使用某個新技術但是領導不愿意，你怎么辦？

創(chuàng)新互聯(lián)建站專注于武平網(wǎng)站建設服務及定制，我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。熱誠為您提供武平營銷型網(wǎng)站建設，武平網(wǎng)站制作、武平網(wǎng)頁設計、武平網(wǎng)站官網(wǎng)定制、微信平臺小程序開發(fā)服務，打造武平網(wǎng)絡公司原創(chuàng)品牌,更為您提供武平網(wǎng)站排名全網(wǎng)營銷落地服務。

對于該問題我相信大家就算沒有面試被問到過，現(xiàn)實工作中同事之間的合作也會遇到。　

因此從我的角度重新去回答這個問題，有以下幾點：

師出有名

在軟件工程里是針對問題場景提供解決方案的，如果脫離的實際問題（需求）去做技術選型，無疑是耍流氓。大家可以回顧身邊的“架構師”、“技術Leader”是不是拍拍腦袋做決定，問他們?yōu)槭裁催@么做，可能連個冠冕堂皇的理由都給不出。

信任度

只有基于上面的條件，你才有理由建議引入新技術。領導愿不愿意引入新技術有很多原因：領導不了解這技術、領導偏保守、領導不是做技術的等。那么我認為這幾種都是信任度，這種信任度分人和事，人就是引入技術的提出者，事就是提出引入的技術。

盡人事

任何問題只是單純解決事都是簡單的，以我以往的做法，把基本資料收集全并以通俗易懂的方式歸納與講解，最好能提供一些能量化的數(shù)據(jù)，這樣更加有說服力。知識普及OK后，就可以嘗試寫方案與做個Demo，方案最好可以提供多個，可以分短期收益與長期收益的。完成上面幾點可以說已經(jīng)盡人事了，如果領導還不答應那么的確有他的顧慮，就算無法落實，到目前為止的收獲也不錯。

復雜的是人

任何人都無法時刻站在理智與客觀的角度去看待問題，事是由人去辦的，所以同一件事由不同的人說出來的效果也不一樣。因此得學會向上管理、保持與同事之間合作融洽度，盡早的建立合作信任。本篇文章更多敘述的事，因此人方面不過多深究，有興趣的我可以介紹一本書《知行技術人的管理之路》。

本篇我的實踐做法與上述一樣，除了4無法體現(xiàn)。那么下文我分了4大模塊：業(yè)務背景介紹、基礎概念講解、方案的選用與技術細節(jié)。

部分源碼，我放到了https://github.com/SkyChenSky/Sikiro 的Sikiro.ES.Api里。

一、背景

本公司多年以來用SQL Server作為主存儲，隨著多年的業(yè)務發(fā)展，已經(jīng)到了數(shù)千萬級的數(shù)據(jù)量。

而部分非核心業(yè)務原本應該超億的量級了，但是因為從物理表的設計優(yōu)化上進行了數(shù)據(jù)壓縮，導致維持在一個比較穩(wěn)定的數(shù)量。壓縮數(shù)據(jù)雖然能減少存儲量，優(yōu)化提供一定的性能，但是同時帶來的損失了業(yè)務可擴展性。舉個例子：我們平臺某個用戶擁有最后訪問作品記錄和總的閱讀時長，但是沒有某個用戶的閱讀明細，那么這樣的設計就會導致后續(xù)新增一個抽獎業(yè)務，需要在某個時間段內(nèi)閱讀了多長時間或者章節(jié)數(shù)量的作品，才能參加與抽獎；或者運營想通過閱讀記錄統(tǒng)計或者分析出，用戶的愛好和受歡迎的作品?，F(xiàn)有的設計對以上兩種業(yè)務情況都是無法滿足的。

此外我們平臺還有作品搜索功能，like ‘%搜索%’查詢是不走索引的而走全表掃描，一張表42W全表掃描，數(shù)據(jù)庫服務器配置可以的情況下還是可以的，但是存在并發(fā)請求時候，資源消耗就特別厲害了，特別是在偶爾被爬蟲爬取數(shù)據(jù)。（我們平臺API的并發(fā)峰值能達到8w/s，每天的接口在淡季請求次數(shù)達到了1億1千萬）

關系型數(shù)據(jù)庫擁有ACID特性，能通過金融級的事務達成數(shù)據(jù)的一致性，然而它卻沒有橫向擴展性，只要在海量數(shù)據(jù)場景下，單實例，無論怎么在關系型數(shù)據(jù)庫做優(yōu)化，都是只是治標。而NoSQL的出現(xiàn)很好的彌補了關系型數(shù)據(jù)庫的短板，在馬丁福勒所著的《NoSQL精粹》對NoSQL進行了分類：文檔型、圖形、列式，鍵值，從我的角度其實可以把搜索引擎納入NoSQL范疇，因為它的確滿足的NoSQL的4大特性：易擴展、大數(shù)據(jù)量高性能、靈活的數(shù)據(jù)模型、高可用。我看過一些同行的見解，把Elasticsearch歸為文檔型NoSQL，我個人是沒有給他下過于明確的定義，這個上面說法大家見仁見智。

MongoDB作為文檔型數(shù)據(jù)庫也屬于我的技術選型范圍，它的讀寫性能高且平衡、數(shù)據(jù)分片與橫向擴展等都非常適合我們平臺部分場景，最后我還是選擇Elasticsearch。原因有三：

我們運維相比于MongoDB更熟悉Elasticsearch。
我們接下來有一些統(tǒng)計報表類的需求，Elastic Stack的各種工具能很好滿足我們的需求。
我們目前著手處理的場景以非實時、純讀為主的業(yè)務，Elasticsearch近實時搜索已經(jīng)能滿足我們。

二、Elasticsearch優(yōu)缺點

百度百科：

Elasticsearch是一個基于Lucene的搜索服務器。它提供了一個分布式多用戶能力的全文搜索引擎，基于RESTful web接口。Elasticsearch由Java語言開發(fā)的，是一種流行的企業(yè)級搜索引擎。Elasticsearch用于云計算中，能夠達到實時搜索，穩(wěn)定，可靠，快速，安裝使用方便。官方客戶端在Java、.NET（C#）、PHP、Python、Apache Groovy、Ruby和許多其他語言中都是可用的。

對于滿足當下的業(yè)務需求和未來支持海量數(shù)據(jù)的搜索，我選擇了Elasticsearch，其實原因主要以下幾點：

那么我個人認為Elasticsearch比較大的缺點只有吃內(nèi)存，具體原因可以看下文內(nèi)存讀取部分。

三、Elasticsearch為什么快？

我個人對于Elasticsearch快的原因主要總結三點：

內(nèi)存讀取
多種索引：倒排索引和doc values。
集群分片

1、內(nèi)存讀取

Elasticsearch是基于Lucene，而Lucene被設計為可以利用操作系統(tǒng)底層機制來緩存內(nèi)存數(shù)據(jù)結構，換句話說Elasticsearch是依賴于操作系統(tǒng)底層的Filesystem Cache，查詢時，操作系統(tǒng)會將磁盤文件里的數(shù)據(jù)自動緩存到 Filesystem Cache 里面去，因此要求Elasticsearch性能足夠高，那么就需要服務器的提供的足夠內(nèi)存給Filesystem Cache 覆蓋存儲的數(shù)據(jù)。

上一段最后一句話什么意思呢？假如：Elasticsearch 節(jié)點有 3 臺服務器各64G內(nèi)存，3臺總內(nèi)存就是 64 * 3 = 192G。每臺機器給 Elasticsearch jvm heap 是 32G，那么每服務器留給 Filesystem Cache 的就是 32G（50%），而集群里的 Filesystem Cache 的就是 32 * 3 = 96G 內(nèi)存。此時，在 3 臺Elasticsearch服務器共占用了 1T 的磁盤容量，那么每臺機器的數(shù)據(jù)量約等于 341G，意味著每臺服務器只有大概10分之1數(shù)據(jù)是緩存在內(nèi)存的，其余都得走硬盤。

說到這里大家未必會有一個直觀得認識，因此我從《大型網(wǎng)站技術架構：核心原理與案例分析》第36頁摳了一張表格下來：

從上圖加粗項看出，內(nèi)存讀取性能是機械磁盤的200倍，是SSD磁盤約等于30倍，假如讀一次Elasticsearch走內(nèi)存場景下耗時20毫秒，那么走機械硬盤就得4秒，走SSD磁盤可能約等于0.6秒。講到這里我相信大家對是否走內(nèi)存的性能差異有一個直觀的認識。

對于Elasticsearch有很多種索引類型，但是我認為核心主要是倒排索引和doc values。

2、倒排索引

Lucene將寫入索引的所有信息組織為倒排索引（inverted index）的結構形式。倒排索引是一種將分詞映射到文檔的數(shù)據(jù)結構，可以認為倒排索引是面向分詞的而不是面向文檔的。

假設在測試環(huán)境的Elasticsearch存放了有以下三個文檔：

Elasticsearch Server（文檔1）
Masterring Elasticsearch（文檔2）
Apache Solr 4 Cookbook（文檔3）

以上文檔索引建好后，簡略顯示如下：

如上表格所示，每個詞項指向該詞項所出現(xiàn)過的文檔位置，這種索引結構允許快速、有效的搜索出數(shù)據(jù)。

3、doc values

對于分組、聚合、排序等某些功能來說，倒排索引的方式并不是最佳選擇，這類功能操作的是文檔而不是詞項，這個時候就得把倒排索引逆轉過來成正排索引，這么做會有兩個缺點：

構建時間長。
內(nèi)存占用大，易OutOfMemory，且影響垃圾回收。

Lucene 4.0之后版本引入了doc values和額外的數(shù)據(jù)結構來解決上面得問題，目前有五種類型的doc values：NUMERIC、BINARY、SORTED、SORTED_SET、SORTED_NUMERIC，針對每種類型Lucene都有特定的壓縮方法。

doc values是列式存儲的正排索引，通過docID可以快速讀取到該doc的特定字段的值，列式存儲存儲對于聚合計算有非常高的性能。

4、集群分片

Elasticsearch可以簡單、快速利用多節(jié)點服務器形成集群，以此分攤服務器的執(zhí)行壓力。

此外數(shù)據(jù)可以進行分片存儲，搜索時并發(fā)到不同服務器上的主分片進行搜索。

這里可以簡單講述下Elasticsearch查詢原理，Elasticsearch的查詢分兩個階段：分散階段與合并階段。

任意一個Elasticsearch節(jié)點都可以接受客戶端的請求。接受到請求后，就是分散階段，并行發(fā)送子查詢給其他節(jié)點；

然后是合并階段，則從眾多分片中收集返回結果，然后對他們進行合并、排序、取長等后續(xù)操作。最終將結果返回給客戶端。

機制如下圖：

分頁深度陷阱

基于以上查詢的原理，擴展一個分頁深度的問題。

現(xiàn)需要查頁長為10、第100頁的數(shù)據(jù)，實際上是會把每個 Shard 上存儲的前 1000（10*100）條數(shù)據(jù)都查到一個協(xié)調(diào)節(jié)點上。如果有 5 個 Shard，那么就有 5000 條數(shù)據(jù)，接著協(xié)調(diào)節(jié)點對這 5000 條數(shù)據(jù)進行一些合并、處理，再獲取到最終第 100 頁的 10 條數(shù)據(jù)。也就是實際上查的數(shù)據(jù)總量為pageSize*pageIndex*shard，頁數(shù)越深則查詢的越慢。因此ElasticSearch也會有要求，每次查詢出來的數(shù)據(jù)總數(shù)不會返回超過10000條。

那么從業(yè)務上盡可能跟產(chǎn)品溝通避免分頁跳轉，使用滾動加載。而Elasticsearch使用的相關技術是search_after、scroll_id。

四、ElasticSearch與數(shù)據(jù)庫基本概念對比

在Elasticsearch 7.0版本之前（<7.0），有type的概念，而Elasticsearch和關系型數(shù)據(jù)庫的關系是，index = database、type = table，但是在Elasticsearch 7.0版本后（>=7.0）弱化了type默認為_doc，而官方會在8.0之后會徹底移除type。

五、服務器選型

在官方文檔（https://www.elastic.co/guide/cn/elasticsearch/guide/current/heap-sizing.html）里建議Elasticsearch JVM Heap最大為32G，同時不超過服務器內(nèi)存的一半，也就是說內(nèi)存分別為128G和64G的服務器，JVM Heap最大只需要設置32G；而32G服務器，則建議JVM Heap最大16G，剩余的內(nèi)存將會給到Filesystem Cache充分使用。如果不需要對分詞字符串做聚合計算（例如，不需要 fielddata ）可以考慮降低JVM Heap。JVM Heap越小，會導致Elasticsearch的GC頻率更高，但Lucene就可以的使用更多的內(nèi)存，這樣性能就會更高。

對于我們公司的未來新增業(yè)務還會有收集用戶的訪問記錄來統(tǒng)計PV(page view)、UV(user view)，有一定的聚合計算，經(jīng)過多方便的考慮與討論，平衡成本與需求后選擇了騰訊云的三臺配置為CPU 16核、內(nèi)存64G，SSD云硬盤的服務器，并給與Elasticsearch 配置JVM Heap = 32G。

六、需求場景選擇

Elasticsearch在本公司系統(tǒng)的可使用場景非常多，但是作為第一次引入因慎重選擇，給與開發(fā)與運維一定的時間熟悉與觀察。

經(jīng)過商討，選擇了兩個業(yè)務場景，用戶閱讀作品的記錄明細與作品搜索，選擇這兩個業(yè)務場景原因如下：

1、寫場景

我們平臺的用戶黏度比較高，閱讀作品是一個高頻率的調(diào)用，因此用戶閱讀作品的記錄明細可在短時間內(nèi)造成海量數(shù)據(jù)的場景。（現(xiàn)一個月已達到了70G的數(shù)據(jù)量，共1億1千萬條）

2、讀場景

閱讀記錄需提供給未來新增的抽獎業(yè)務使用，可從閱讀章節(jié)數(shù)、閱讀時長等進行搜索計算。
作品搜索原有實現(xiàn)是通過關系型數(shù)據(jù)庫like查詢，已是具有潛在的性能問題與資源消耗的業(yè)務場景。

對于上述兩個業(yè)務，用戶閱讀作品的記錄明細與抽獎業(yè)務屬于新增業(yè)務，對于在投入成本相對較少，也無需過多的需要兼容舊業(yè)務的壓力。

而作品搜索業(yè)務屬于優(yōu)化改造，得保證兼容原有的用戶搜索習慣前提下，新增拼音搜索。同時最好以擴展的方式，盡可能的減少代碼修改范圍，如果使用效果不好，隨時可以回滾到舊的實現(xiàn)方式。

七、設計方案

1、共性設計

我使用.Net 5 WebApi將Elasticsearch封裝成ES業(yè)務服務API，這樣的做法主要用來隱藏技術細節(jié)（時區(qū)、分詞器、類型轉換等），暴露粗粒度的讀寫接口。這種做法在馬丁福勒所著的《NoSQL精粹》稱把數(shù)據(jù)庫視為“應用程序數(shù)據(jù)庫”，簡單來說就是只能通過應用間接的訪問存儲，對于這個應用由一個團隊負責維護開發(fā)，也只有這個團隊才知道存儲的結構。這樣通過封裝的API服務解耦了外部API服務與存儲，調(diào)用方就無需過多關注存儲的特性，像Mongodb與Elasticsearch這種無模式的存儲，無需優(yōu)先定義結構，換而言之就是對于存儲已有結構可隨意修改擴展，那么“應用程序數(shù)據(jù)庫”的做法也避免了其他團隊無意侵入的修改。

考慮到現(xiàn)在業(yè)務需求復雜度相對簡單，MQ消費端也一起集成到ES業(yè)務服務，若后續(xù)MQ消費業(yè)務持續(xù)增多，再考慮把MQ消費業(yè)務抽離到一個（或多個的）消費端進程。

目前以同步讀、同步寫、異步寫的三種交互方式，進行與其他服務通信。

2、閱讀記錄明細

本需求是完全新增，因此引入相對簡單，只需要在【平臺API】使用【RabbitMQ】進行解耦，使用異步方式寫入Elasticsearch，使用隊列除了用來解耦，還對此用來緩沖高并發(fā)寫壓力的情況。

對于后續(xù)新增的業(yè)務例如抽獎服務，則只需要通過RPC框架對接ES業(yè)務API，以同步讀取的方式查詢數(shù)據(jù)。

3、作品搜索

對于該業(yè)務，我第一反應采用CQRS的思想，原有的寫入邏輯我無需過多的關注與了解，因此我只需要想辦法把關系型數(shù)據(jù)庫的數(shù)據(jù)同步到Elasticsearch，然后提供業(yè)務查詢API替換原有平臺API的數(shù)據(jù)源即可。

那么數(shù)據(jù)同步則一般都是分推和拉兩種方式。

4、推

推的實時性無疑是比拉要高，只需增量的推送做寫入的數(shù)據(jù)（增、刪、改）即可，無論是從性能、資源利用、時效各方面來看都比拉更有效。

實施該方案，可以選擇Debezium和SQL Server開啟CDC功能。

Debezium由RedHat開源的，同時需要依賴于kafka的，一個將多種數(shù)據(jù)源實時變更數(shù)據(jù)捕獲，形成數(shù)據(jù)流輸出的開源工具，同類產(chǎn)品有Canal, DataBus, Maxwell。

CDC全稱Change Data Capture，直接翻譯過來為變更數(shù)據(jù)捕獲，核心為監(jiān)測服務捕獲數(shù)據(jù)庫的寫操作（插入，更新，刪除），將這些變更按發(fā)生的順序完整記錄下來。

我個人在我博客文章多次強調(diào)架構設計的輸入核心為兩點：滿足需求與組織架構，在滿足需求的前提應優(yōu)先選擇簡單、合適的方案。技術選型應需要考慮自己的團隊是否可以支撐。在上述無論是額外加入Debezium和kafka，還是需要針對SQL Server開啟CDC都超出了我們運維所能承受的極限，引入新的中間件和技術是需要試錯的，而試錯是需要額外高的成本，在未知的情況下引入更多的未知，只會造成更大的成本和不可控。

5、拉

拉無疑是最簡單最合適的實現(xiàn)方式，只需要使用調(diào)度任務服務，每隔段時間定時去從數(shù)據(jù)庫拉取數(shù)據(jù)寫入到Elasticsearch就可。

然而拉取數(shù)據(jù)，分全量同步與增量同步：

對于增量同步，只需要每次查詢數(shù)據(jù)源Select * From Table_A Where RowVersion > LastUpdateVersion，則可以過濾出需要同步的數(shù)據(jù)。但是這個方式有點致命的缺點，數(shù)據(jù)源已被刪除的數(shù)據(jù)是無法查詢出來的，如果把Elasticsearch反向去跟SQL Server數(shù)據(jù)做對比又是一件比較愚蠢的方式，因此只能放棄該方式。

而全量同步，只要每次從SQL Server數(shù)據(jù)源全量新增到Elasticsearch，并替換舊的Elasticsearch的Index，因此該方案得全刪全增。但是這里又引申出新的問題，如果先刪后增，那么在刪除后再新增的這段真空期怎么辦？假如有5分鐘的真空期是沒有數(shù)據(jù)，用戶就無法使用搜索功能。那么只能先增后刪，先新增到一個Index_Temp，全量新增完后，把原有Index改名成Index_Delete，然后再把Index_Temp改成Index，最后把Index_Delete刪除。這么一套操作下來，有沒有覺得很繁瑣很費勁？Elasticsearch有一個叫別名（Aliases）的功能，別名可以一對多的指向多個Index，也可以以原子性的進行別名指向Index的切換，具體實現(xiàn)可以看下文。

八、閱讀記錄實現(xiàn)細節(jié)

1、實體定義

優(yōu)先定義了個抽象類ElasticsearchEntity進行復用，對于實體定義有三個注意的細節(jié)點：

對于ElasticsearchEntity我定義兩個屬性_id與Timestamp，Elasticsearch是無模式的（無需預定義結構），如果實體本身沒有_id，寫入到Elasticsearch會自動生成一個_id，為了后續(xù)的使用便捷性，我仍然自主定義了一個。

基于上述的分頁深度的問題，因此在后續(xù)涉及的業(yè)務盡可能會以search_after+滾動加載的方式落實到我們的業(yè)務。原本我們只需要使用DateTime類型的字段用DateTime.Now記錄后，再使用search_after后會自動把DateTime類型字段轉換成毫秒級的Timestamp，但是我在實現(xiàn)demo的時候，去制造數(shù)據(jù)，在程序里以for循環(huán)new數(shù)據(jù)的時候，發(fā)現(xiàn)生成的速度會在微秒級之間，那么假設用毫秒級的Timestamp進行search_after過濾，同一個毫秒有4、5條數(shù)據(jù)，那么容易在使用滾動加載時候少加載了幾條數(shù)據(jù)，這樣就到導致數(shù)據(jù)返回不準確了。因此我擴展了個[DateTime.Now.DateTimeToTimestampOfMicrosecond()]生成微秒級的Timestamp，以此盡可能減少出現(xiàn)漏加載數(shù)據(jù)的情況。

對于Elasticsearch的操作實體的日期時間類型均以DateTimeOffset類型聲明，因為Elasticsearch存儲的是UTC時間，而且會因為Http請求的日期格式不同導致存放的日期時間也會有所偏差，為了避免日期問題使用DateTimeOffset類型是一種保險的做法。而對于WebAPI 接口或者MQ的Message接受的時間類型可以使用DateTime類型，DTO(傳輸對象)與DO（持久化對象）使用Mapster或者AutoMapper類似的對象映射工具進行轉換即可（注意DateTimeOffset轉DateTime得定義轉換規(guī)則 [TypeAdapterConfig.NewConfig().MapWith(dateTimeOffset => dateTimeOffset.LocalDateTime)]）。

如此一來，把Elasticsearch操作細節(jié)隱藏在WebAPI里，以友好、簡單的接口暴露給開發(fā)者使用，降低了開發(fā)者對技術細節(jié)認知負擔。

  [ElasticsearchType(RelationName = "user_view_duration")]
    public class UserViewDuration : ElasticsearchEntity
    {
        /// 
        /// 作品ID
        /// 

        [Number(NumberType.Long, Name = "entity_id")]
        public long EntityId { get; set; }
        /// 
        /// 作品類型
        /// 

        [Number(NumberType.Long, Name = "entity_type")]
        public long EntityType { get; set; }
        /// 
        /// 章節(jié)ID
        /// 

        [Number(NumberType.Long, Name = "charpter_id")]
        public long CharpterId { get; set; }
        /// 
        /// 用戶ID
        /// 

        [Number(NumberType.Long, Name = "user_id")]
        public long UserId { get; set; }
        /// 
        /// 創(chuàng)建時間
        /// 

        [Date(Name = "create_datetime")]
        public DateTimeOffset CreateDateTime { get; set; }
        /// 
        /// 時長
        /// 

        [Number(NumberType.Long, Name = "duration")]
        public long Duration { get; set; }
        /// 
        /// IP
        /// 

        [Ip(Name = "Ip")]
        public string Ip { get; set; }
    }

public abstract class ElasticsearchEntity
    {
        private Guid? _id;

        public Guid Id
        {
            get
            {
                _id ??= Guid.NewGuid();
                return _id.Value;
            }
            set => _id = value;
        }

        private long? _timestamp;

        [Number(NumberType.Long, Name = "timestamp")]
        public long Timestamp
        {
            get
            {
                _timestamp ??= DateTime.Now.DateTimeToTimestampOfMicrosecond();
                return _timestamp.Value;
            }
            set => _timestamp = value;
        }
    }

?2、異步寫入

對于異步寫入有兩個細節(jié)點：

該數(shù)據(jù)從RabbtiMQ訂閱消費寫入到Elasticsearch，從下面代碼可以看出，我刻意以月的維度建立Index，格式為 userviewrecord-2021-12，這么做的目的是為了方便管理Index和資源利用，有需要的情況下會刪除舊的Index。

消息訂閱與WebAPI暫時集成到同一個進程，這樣做主要是開發(fā)、部署都方便，如果后續(xù)訂閱多了，在把消息訂閱相關的業(yè)務抽離到獨立的進程。

1）按需演變，避免過度設計

① 訂閱消費邏輯

public class UserViewDurationConsumer : BaseConsumer
    {
        private readonly ElasticClient _elasticClient;

        public UserViewDurationConsumer(ElasticClient elasticClient)
        {
            _elasticClient = elasticClient;
        }

        public override void Excute(UserViewDurationMessage msg)
        {
            var document = msg.MapTo();

            var result = _elasticClient.Create(document, a => a.Index(typeof(Entity.UserViewDuration).GetRelationName() + "-" + msg.CreateDateTime.ToString("yyyy-MM"))).GetApiResult();
            if (result.Failed)
                LoggerHelper.WriteToFile(result.Message);
        }
    }

/// 
    /// 訂閱消費
    /// 

    public static class ConsumerExtension
    {
        public static IApplicationBuilder UseSubscribe(this IApplicationBuilder appBuilder, IHostApplicationLifetime lifetime) where T : EasyNetQEntity, new() where TConsumer : BaseConsumer
        {
            var bus = appBuilder.ApplicationServices.GetRequiredService();
            var consumer = appBuilder.ApplicationServices.GetRequiredService();

            lifetime.ApplicationStarted.Register(() =>
            {
                bus.Subscribe(msg => consumer.Excute(msg));
            });

            lifetime.ApplicationStopped.Register(() => bus?.Dispose());

            return appBuilder;
        }
    }

② 訂閱與注入


public class Startup
    {
        public Startup(IConfiguration configuration)
        {
            Configuration = configuration;
        }

        public IConfiguration Configuration { get; }

        public void ConfigureServices(IServiceCollection services)
        {
            ......
        }

        public void Configure(IApplicationBuilder app, IWebHostEnvironment env, IHostApplicationLifetime lifetime)
        {
            app.UseAllElasticApm(Configuration);

            app.UseHealthChecks("/health");

            app.UseDeveloperExceptionPage();
            app.UseSwagger();
            app.UseSwaggerUI(c =>
            {
                c.SwaggerEndpoint("/swagger/v1/swagger.json", "SF.ES.Api v1");
                c.RoutePrefix = "";
            });

            app.UseRouting();
            app.UseEndpoints(endpoints =>
            {
                endpoints.MapControllers();
            });

            app.UseSubscribe(lifetime);
        }
    }

?3、查詢接口

查詢接口此處有兩個細節(jié)點：

如果不確定月份，則使用通配符查詢userviewrecord-*，當然有需要的也可以使用別名處理。

因為Elasticsearch是記錄UTC時間，因此時間查詢得指定TimeZone。

 [HttpGet]
        [Route("record")]
        public ApiResult> GetRecord([FromQuery] UserViewDurationRecordGetRequest request)
        {
            var dataList = new List();

            string dateTime;

            if (request.BeginDateTime.HasValue && request.EndDateTime.HasValue)
            {
                var month = request.EndDateTime.Value.DifferMonth(request.BeginDateTime.Value);

                if(month <= 0 )
                    dateTime = request.BeginDateTime.Value.ToString("yyyy-MM");
                else
                    dateTime = "*";
            }
            else
                dateTime = "*";

            var mustQuerys = new List, QueryContainer>>();

            if (request.UserId.HasValue)
                mustQuerys.Add(a => a.Term(t => t.Field(f => f.UserId).Value(request.UserId.Value)));

            if (request.EntityType.HasValue)
                mustQuerys.Add(a => a.Term(t => t.Field(f => f.EntityType).Value(request.EntityType)));

            if (request.EntityId.HasValue)
                mustQuerys.Add(a => a.Term(t => t.Field(f => f.EntityId).Value(request.EntityId.Value)));

            if (request.CharpterId.HasValue)
                mustQuerys.Add(a => a.Term(t => t.Field(f => f.CharpterId).Value(request.CharpterId.Value)));

            if (request.BeginDateTime.HasValue)
                mustQuerys.Add(a => a.DateRange(dr =>
                    dr.Field(f => f.CreateDateTime).GreaterThanOrEquals(request.BeginDateTime.Value).TimeZone(EsConst.TimeZone)));

            if (request.EndDateTime.HasValue)
                mustQuerys.Add(a =>
                    a.DateRange(dr => dr.Field(f => f.CreateDateTime).LessThanOrEquals(request.EndDateTime.Value).TimeZone(EsConst.TimeZone)));

            var searchResult = _elasticClient.Search(a =>
                a.Index(typeof(UserViewDuration).GetRelationName() + "-" + dateTime)
                    .Size(request.Size)
                    .Query(q => q.Bool(b => b.Must(mustQuerys)))
                    .SearchAfterTimestamp(request.Timestamp)
                    .Sort(s => s.Field(f => f.Timestamp, SortOrder.Descending)));

            var apiResult = searchResult.GetApiResult>();
            if (apiResult.Success)
                dataList.AddRange(apiResult.Data);

            return ApiResult>.IsSuccess(dataList);
        }

?九、作品搜索實現(xiàn)細節(jié)

1、實體定義

SearchKey是原有SQL Server的數(shù)據(jù)，現(xiàn)需要同步到Elasticsearch，仍是繼承抽象類。ElasticsearchEntity實體定義，同時這里有三個細節(jié)點：

public string KeyName，我定義的是Text類型，在Elasticsearch使用Text類型才會分詞。

在實體定義我沒有給KeyName指定分詞器，因為我會使用兩個分詞器：拼音和默認分詞，而我會在批量寫入數(shù)據(jù)創(chuàng)建Mapping時定義。

實體里的 public List SysTagId 與SearchKey在SQL Server是兩張不同的物理表，是一對多的關系，在代碼表示如下，但是在關系型數(shù)據(jù)庫是無法與之對應和體現(xiàn)的，這就是咱們所說的“阻抗失配”，但是能在以文檔型存儲系統(tǒng)（MongoDB、Elasticsearch）里很好的解決這個問題，可以以一個聚合的方式寫入，避免多次查詢關聯(lián)。?

[ElasticsearchType(RelationName = "search_key")]
    public class SearchKey : ElasticsearchEntity
    {
        [Number(NumberType.Integer, Name = "key_id")]
        public int KeyId { get; set; }

        [Number(NumberType.Integer, Name = "entity_id")]
        public int EntityId { get; set; }

        [Number(NumberType.Integer, Name = "entity_type")]
        public int EntityType { get; set; }

        [Text(Name = "key_name")]
        public string
                                                網(wǎng)頁名稱：計劃將Elasticsearch引入系統(tǒng)架構，領導卻死活不同意……                                                

                                                鏈接URL：http://www.5511xx.com/article/dpspdog.html

日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

新聞中心

?前言

一、背景

二、Elasticsearch優(yōu)缺點

百度百科：

三、Elasticsearch為什么快？

1、內(nèi)存讀取

2、倒排索引

3、doc values

4、集群分片

四、ElasticSearch與數(shù)據(jù)庫基本概念對比

五、服務器選型

六、需求場景選擇

1、寫場景

2、讀場景

七、設計方案

1、共性設計

2、閱讀記錄明細

3、作品搜索

4、推

5、拉

八、閱讀記錄實現(xiàn)細節(jié)

1、實體定義

?2、異步寫入

?3、查詢接口

?九、作品搜索實現(xiàn)細節(jié)

1、實體定義

其他資訊

新聞中心

?前言

一、背景

二、Elasticsearch優(yōu)缺點

百度百科 ：

三、Elasticsearch為什么快？

1、內(nèi)存讀取

2、倒排索引

3、doc values

4、集群分片

四、ElasticSearch與數(shù)據(jù)庫基本概念對比

五、服務器選型

六、需求場景選擇

1、寫場景

2、讀場景

七、設計方案

1、共性設計

2、閱讀記錄明細

3、作品搜索

4、推

5、拉

八、閱讀記錄實現(xiàn)細節(jié)

1、實體定義

?2、異步寫入

?3、查詢接口

?九、作品搜索實現(xiàn)細節(jié)

1、實體定義

其他資訊

一、背景

二、Elasticsearch優(yōu)缺點

百度百科：

三、Elasticsearch為什么快？

1、內(nèi)存讀取

2、倒排索引

4、集群分片

四、ElasticSearch與數(shù)據(jù)庫基本概念對比

五、服務器選型

六、需求場景選擇

1、寫場景

七、設計方案

1、共性設計

2、閱讀記錄明細

4、推

5、拉

八、閱讀記錄實現(xiàn)細節(jié)

1、實體定義

?2、異步寫入

?九、作品搜索實現(xiàn)細節(jié)

1、實體定義