]> git.openstreetmap.org Git - chef.git/blob - cookbooks/hardware/recipes/default.rb
Add smartd monitory for disks on Areca controllers
[chef.git] / cookbooks / hardware / recipes / default.rb
1 #
2 # Cookbook Name:: hardware
3 # Recipe:: default
4 #
5 # Copyright 2012, OpenStreetMap Foundation
6 #
7 # Licensed under the Apache License, Version 2.0 (the "License");
8 # you may not use this file except in compliance with the License.
9 # You may obtain a copy of the License at
10 #
11 #     http://www.apache.org/licenses/LICENSE-2.0
12 #
13 # Unless required by applicable law or agreed to in writing, software
14 # distributed under the License is distributed on an "AS IS" BASIS,
15 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
16 # See the License for the specific language governing permissions and
17 # limitations under the License.
18 #
19
20 case node[:cpu][:"0"][:vendor_id]
21 when "GenuineIntel"
22   package "intel-microcode"
23 end
24
25 case node[:cpu][:"0"][:vendor_id]
26 when "AuthenticAMD"
27   if node[:lsb][:release].to_f >= 14.04
28     package "amd64-microcode"
29   end
30 end
31
32 if node[:dmi] && node[:dmi][:system]
33   case node[:dmi][:system][:manufacturer]
34   when "empty"
35     manufacturer = node[:dmi][:base_board][:manufacturer]
36     product = node[:dmi][:base_board][:product_name]
37   else
38     manufacturer = node[:dmi][:system][:manufacturer]
39     product = node[:dmi][:system][:product_name]
40   end
41 else
42   manufacturer = "Unknown"
43   product = "Unknown"
44 end
45
46 case manufacturer
47 when "HP"
48   package "hponcfg"
49   package "hp-health"
50   unit = "1"
51   speed = "115200"
52 when "TYAN"
53   unit = "0"
54   speed = "115200"
55 when "TYAN Computer Corporation"
56   unit = "0"
57   speed = "115200"
58 when "Supermicro"
59   case product
60   when "H8DGU", "X9SCD", "X7DBU", "X7DW3", "X9DR7/E-(J)LN4F", "X9DR3-F", "X9DRW"
61     unit = "1"
62     speed = "115200"
63   else
64     unit = "0"
65     speed = "115200"
66   end
67 when "IBM"
68   unit = "0"
69   speed = "115200"
70 end
71
72 if manufacturer == "HP" && node[:lsb][:release].to_f > 11.10
73   include_recipe "git"
74
75   git "/opt/hp/hp-legacy" do
76     action :sync
77     repository "git://chef.openstreetmap.org/hp-legacy.git"
78     user "root"
79     group "root"
80   end
81
82   link "/opt/hp/hp-health/bin/hpasmd" do
83     to "/opt/hp/hp-legacy/hpasmd"
84   end
85
86   link "/usr/lib/libhpasmintrfc.so.3.0" do
87     to "/opt/hp/hp-legacy/libhpasmintrfc.so.3.0"
88   end
89
90   link "/usr/lib/libhpasmintrfc.so.3" do
91     to "libhpasmintrfc.so.3.0"
92   end
93
94   link "/usr/lib/libhpasmintrfc.so" do
95     to "libhpasmintrfc.so.3.0"
96   end
97 end
98
99 unless unit.nil?
100   file "/etc/init/ttySttyS#{unit}.conf" do
101     action :delete
102   end
103
104   template "/etc/init/ttyS#{unit}.conf" do
105     source "tty.conf.erb"
106     owner "root"
107     group "root"
108     mode 0644
109     variables :unit => unit, :speed => speed
110   end
111
112   service "ttyS#{unit}" do
113     provider Chef::Provider::Service::Upstart
114     action [:enable, :start]
115     supports :status => true, :restart => true, :reload => false
116     subscribes :restart, "template[/etc/init/ttyS#{unit}.conf]"
117   end
118 end
119
120 if File.exist?("/etc/default/grub")
121   execute "update-grub" do
122     action :nothing
123     command "/usr/sbin/update-grub"
124   end
125
126   template "/etc/default/grub" do
127     source "grub.erb"
128     owner "root"
129     group "root"
130     mode 0644
131     variables :unit => unit, :speed => speed
132     notifies :run, "execute[update-grub]"
133   end
134 end
135
136 execute "update-initramfs" do
137   action :nothing
138   command "update-initramfs -u -k all"
139   user "root"
140   group "root"
141 end
142
143 template "/etc/initramfs-tools/conf.d/mdadm" do
144   source "initramfs-mdadm.erb"
145   owner "root"
146   group "root"
147   mode 0644
148   notifies :run, "execute[update-initramfs]"
149 end
150
151 package "haveged"
152 service "haveged" do
153   action [:enable, :start]
154 end
155
156 if node[:kernel][:modules].include?("ipmi_si")
157   package "ipmitool"
158 end
159
160 if node[:lsb][:release].to_f >= 12.10
161   package "irqbalance"
162
163   template "/etc/default/irqbalance" do
164     source "irqbalance.erb"
165     owner "root"
166     group "root"
167     mode 0644
168   end
169
170   service "irqbalance" do
171     action [:start, :enable]
172     supports :status => false, :restart => true, :reload => false
173     subscribes :restart, "template[/etc/default/irqbalance]"
174   end
175 end
176
177 tools_packages = []
178 status_packages = {}
179
180 node[:kernel][:modules].each_key do |modname|
181   case modname
182   when "cciss"
183     tools_packages << "hpacucli"
184     status_packages["cciss-vol-status"] ||= []
185   when "hpsa"
186     tools_packages << "hpacucli"
187     status_packages["cciss-vol-status"] ||= []
188   when "mptsas"
189     tools_packages << "lsiutil"
190     # status_packages["mpt-status"] ||= []
191   when "mpt2sas"
192     tools_packages << "sas2ircu"
193     status_packages["sas2ircu-status"] ||= []
194   when "megaraid_mm"
195     tools_packages << "megactl"
196     status_packages["megaraid-status"] ||= []
197   when "megaraid_sas"
198     tools_packages << "megacli"
199     status_packages["megaclisas-status"] ||= []
200   when "aacraid"
201     tools_packages << "arcconf"
202     status_packages["aacraid-status"] ||= []
203   when "arcmsr"
204     tools_packages << "areca"
205   end
206 end
207
208 node[:block_device].each do |name, attributes|
209   next unless attributes[:vendor] == "HP" && attributes[:model] == "LOGICAL VOLUME"
210
211   if name =~ /^cciss!(c[0-9]+)d[0-9]+$/
212     status_packages["cciss-vol-status"] |= ["cciss/#{Regexp.last_match[1]}d0"]
213   else
214     Dir.glob("/sys/block/#{name}/device/scsi_generic/*").each do |sg|
215       status_packages["cciss-vol-status"] |= [File.basename(sg)]
216     end
217   end
218 end
219
220 %w(hpacucli lsiutil sas2ircu megactl megacli arcconf).each do |tools_package|
221   if tools_packages.include?(tools_package)
222     package tools_package
223   else
224     package tools_package do
225       action :purge
226     end
227   end
228 end
229
230 if tools_packages.include?("areca")
231   include_recipe "git"
232
233   git "/opt/areca" do
234     action :sync
235     repository "git://chef.openstreetmap.org/areca.git"
236     user "root"
237     group "root"
238   end
239 else
240   directory "/opt/areca" do
241     action :delete
242     recursive true
243   end
244 end
245
246 ["cciss-vol-status", "mpt-status", "sas2ircu-status", "megaraid-status", "megaclisas-status", "aacraid-status"].each do |status_package|
247   if status_packages.include?(status_package)
248     package status_package
249
250     template "/etc/default/#{status_package}d" do
251       source "raid.default.erb"
252       owner "root"
253       group "root"
254       mode 0644
255       variables :devices => status_packages[status_package]
256     end
257
258     service "#{status_package}d" do
259       action [:start, :enable]
260       supports :status => false, :restart => true, :reload => false
261       subscribes :restart, "template[/etc/default/#{status_package}d]"
262     end
263   else
264     package status_package do
265       action :purge
266     end
267
268     file "/etc/default/#{status_package}d" do
269       action :delete
270     end
271   end
272 end
273
274 disks = []
275
276 node[:block_device].each do |name, attributes|
277   disks << { :device => name } if attributes[:vendor] == "ATA"
278 end
279
280 if status_packages["cciss-vol-status"]
281   status_packages["cciss-vol-status"].each do |device|
282     IO.popen(["cciss_vol_status", "-V", "/dev/#{device}"]).each do |line|
283       disks << { :device => device, :driver => "cciss", :id => Regexp.last_match[1].to_i - 1 } if line =~ / bay ([0-9]+) +HP /
284     end
285   end
286 end
287
288 if status_packages["megaclisas-status"]
289   controller = 0
290
291   Dir.glob("/sys/class/scsi_host/host*") do |host|
292     driver = File.new("#{host}/proc_name").read.chomp
293
294     next unless driver == "megaraid_sas"
295
296     bus = host.sub("/sys/class/scsi_host/host", "")
297     device = File.basename(Dir.glob("/sys/bus/scsi/devices/#{bus}:*/scsi_generic/*").first)
298
299     IO.popen(["megacli", "-PDList", "-a#{controller}", "-NoLog"]).each do |line|
300       disks << { :device => device, :driver => "megaraid",  :id => Regexp.last_match[1] } if line =~ /^Device Id: ([0-9]+)$/
301
302       disks.pop if line =~ /^Firmware state: Hotspare, Spun down$/
303     end
304
305     controller += 1
306   end
307 end
308
309 if status_packages["sas2ircu-status"]
310   Dir.glob("/sys/class/scsi_host/host*") do |host|
311     driver = File.new("#{host}/proc_name").read.chomp
312
313     next unless driver == "mpt2sas"
314
315     bus = host.sub("/sys/class/scsi_host/host", "")
316
317     Dir.glob("/sys/bus/scsi/devices/#{bus}:0:*/scsi_generic/*").each do |sg|
318       disks << { :device => File.basename(sg) }
319     end
320   end
321 end
322
323 if status_packages["aacraid-status"]
324   Dir.glob("/sys/class/scsi_host/host*") do |host|
325     driver = File.new("#{host}/proc_name").read.chomp
326
327     next unless driver == "aacraid"
328
329     bus = host.sub("/sys/class/scsi_host/host", "")
330
331     Dir.glob("/sys/bus/scsi/devices/#{bus}:1:*/scsi_generic/*").each do |sg|
332       disks << { :device => File.basename(sg) }
333     end
334   end
335 end
336
337 if tools_packages.include?("areca")
338   device = IO.popen(["lsscsi", "-g"]).grep(%r{Areca +RAID controller .*/dev/(sg[0-9]+)}) do
339     Regexp.last_match[1]
340   end.first
341
342   IO.popen(["/opt/areca/x86_64/cli64", "disk", "info"]).each do |line|
343     next if line =~ /N\.A\./
344
345     if line =~ /^ +[0-9]+ +0*([0-9]+) +(?:Slot#|SLOT )0*([0-9]+) +/
346       enc = Regexp.last_match[1]
347       slot = Regexp.last_match[2]
348
349       disks << { :device => device, :driver => "areca", :id => "#{slot}/#{enc}" }
350     elsif line =~ /^ +([0-9]+) +[0-9]+ +/
351       disks << { :device => device, :driver => "areca", :id => Regexp.last_match[1] }
352     end
353   end
354 end
355
356 if disks.count > 0
357   package "smartmontools"
358
359   template "/etc/smartd.conf" do
360     source "smartd.conf.erb"
361     owner "root"
362     group "root"
363     mode 0644
364     variables :disks => disks
365     notifies :reload, "service[smartmontools]"
366   end
367
368   template "/etc/default/smartmontools" do
369     source "smartmontools.erb"
370     owner "root"
371     group "root"
372     mode 0644
373     notifies :restart, "service[smartmontools]"
374   end
375
376   service "smartmontools" do
377     action [:enable, :start]
378   end
379 else
380   service "smartmontools" do
381     action [:stop, :disable]
382   end
383 end
384
385 if File.exist?("/etc/mdadm/mdadm.conf")
386   mdadm_conf = edit_file "/etc/mdadm/mdadm.conf" do |line|
387     line.gsub!(/^MAILADDR .*$/, "MAILADDR admins@openstreetmap.org")
388
389     line
390   end
391
392   file "/etc/mdadm/mdadm.conf" do
393     owner "root"
394     group "root"
395     mode 0644
396     content mdadm_conf
397   end
398
399   service "mdadm" do
400     action :nothing
401     subscribes :restart, "file[/etc/mdadm/mdadm.conf]"
402   end
403 end
404
405 template "/etc/modules" do
406   source "modules.erb"
407   owner "root"
408   group "root"
409   mode 0644
410 end
411
412 if node[:lsb][:release].to_f <= 12.10
413   service "module-init-tools" do
414     provider Chef::Provider::Service::Upstart
415     action :nothing
416     subscribes :start, "template[/etc/modules]"
417   end
418 else
419   service "kmod" do
420     provider Chef::Provider::Service::Upstart
421     action :nothing
422     subscribes :start, "template[/etc/modules]"
423   end
424 end
425
426 if node[:hardware][:watchdog]
427   package "watchdog"
428
429   template "/etc/default/watchdog" do
430     source "watchdog.erb"
431     owner "root"
432     group "root"
433     mode 0644
434     variables :module => node[:hardware][:watchdog]
435   end
436
437   service "watchdog" do
438     action [:enable, :start]
439   end
440 end
441
442 unless Dir.glob("/sys/class/hwmon/hwmon*").empty?
443   package "lm-sensors"
444
445   execute "/etc/sensors.d/chef.conf" do
446     action :nothing
447     command "/usr/bin/sensors -s"
448     user "root"
449     group "root"
450   end
451
452   template "/etc/sensors.d/chef.conf" do
453     source "sensors.conf.erb"
454     owner "root"
455     group "root"
456     mode 0644
457     notifies :run, "execute[/etc/sensors.d/chef.conf]"
458   end
459 end