tesseract ocr 圖像辨識安裝

因為爬網頁的需求,需要取得驗證碼,所以就有了圖像辨識的需求,因為平常都用 windows, 所以以下的安裝以 windows 為範例 安裝 連到 https://github.com/UB-Mannheim/tesseract/wiki 下載 tesseract-ocr-w32-setup-v4.0.0-beta.1.20180608.exe 安裝完後需要把安裝路徑加入到 path 裡面, »

Elasticsearch Restore

今天手滑不小心把 production 的 index 刪除了,嚇都嚇死了...幸好平時有做備份,今天剛好臨時演練一下,所以有了這一篇文章,因為我指誤刪了一個 index, 但我平常備份是整個 cluster 備份,所以這本是從 cluster 的完整備份檔取一個 index 來做還原。 首先需要把你的 index 先 close,之後再進行還原,當 Elasticsearch »

資ˋ料庫設計

整理一下過去設計資料庫的一下經驗 資料庫依照環境命名,例如資料庫的名稱叫做 abc,那在 DEV 環境下我們就叫做 dev.abc, 在 UAT 環境下我們就叫做 uat.abc,在 prod 的環境下就叫做 prod.abc 盡量不用 join 和 foreign key,對 performance »

如何關閉 container 的 auto-restart

有時候我們直接用 docker run restart=always,這樣當我們想要停止 container 的時候,單純用 docker container stop XXX 是只做一半,雖然 container 是被停止了,但當系統重啟或是docker服務重啟時,這個 container 又會出現。 比較正確的做法,我們可能需要先更新 container 讓他不在重啟 docker »

X-Forwarded-For 和 X-Real-Ip 的差異

最近因為抓 client 的IP遇到一些問題,又從重新回來研究這兩個東西,才發現我之前針對 X-Real-Ip 的理解是錯誤的 XD,所以只好寫一下這篇筆記一下。 我們先假設一個場景: 使用者(1.1.1.1) --> CDN (2.2.2.2) --> API Gateway (3.3. »

Docker registry 空間清除

目前透過一些 registry Web管理工具,都無法成功刪除 image 的空間,後來在網上找了一些資料,但最後面只有把空間從 52 GB 降到 47 GB 在 docker registry node 上面設定環境變數 REGISTRY_STORAGE_DELETE_ENABLED: true 登入 registry container »

Linux 時間對時

每一台 linux 都應該需要作時間對時,這邊用的是 chrony 套件在 centos7 的環境下來跟 ntp 作對時的動作 安裝套件 sudo sudo yum erase ntp* sudo yum -y install chrony sudo service chronyd start 添加對時主機 »

回復 docker swarm

如果遇到一些問題需要用原本某台 manager 裡面的資料來重建 docker swarm cluster的話,可以在 manager 節點上輸入 docker swarm init --force-new-cluster ,這如果資料不再這個節點上面將會遺失掉,所以建議找有 service 跑在上面的節點,這樣有些重要的資訊才會被同步過去。如果發現某個 manager node 的節點的 status 是 down 的話, »

關閉 linux swap 空間

nux 會使用硬盤的一部分做為SWAP分區,用來進行進程調度--進程是正在運行的程序--把當前不用的進程調成『等待(standby)『,甚至『睡眠(sleep)』,一旦要用,再調成『活動(active)』,睡眠的進程就躺到SWAP分區睡大覺,把內存空出來讓給『活動』的進程。如果內存夠大,應當告訴 linux 不必太多的使用 SWAP 分區, 可以通過修改 swappiness 的數值。swappiness= »

CDN with WebFronts

當透過 CDN 下在 WebFonts 會遇到 cross domain 的問題,記得需要特別處裡 reference: https://www.maxcdn.com/one/tutorial/how-to-use-cdn-with-webfonts/ »