“FL 流程始于與所有設備共享的全局模型。每臺設備在本地訓練模型,并將更新發(fā)送到中央服務(wù)器,在那里匯總以改進(jìn)模型,”學(xué)者們說(shuō)。“然后將這個(gè)更新的模型分發(fā)回設備進(jìn)行進(jìn)一步訓練。FL 循環(huán)迭代多次,直到全局模型達到所需的最佳精度。”
該團隊的模型在每臺機器上本地運行,包括一個(gè)長(cháng)短期記憶 (LSTM) 架構、一個(gè) dropout 單元和兩個(gè)完全連接的密集層。LSTM 處理順序數據,而 dropout 單元減少過(guò)度擬合,密集層有助于做出最終預測。
該模型還使用超參數來(lái)調整本地 LSTM 模型并在中央服務(wù)器上對類(lèi)似客戶(hù)端進(jìn)行聚類(lèi)。這些超參數在訓練開(kāi)始前設置,控制著(zhù)機器學(xué)習模型的訓練過(guò)程。