Một phương pháp tăng tốc khả năng hội tụ đối với gradient descent