首页> 快讯

PIE-Engine实践篇|巧用map算子提高效率

2021-11-25 13:47:59中国科技新闻网


  PIE-Engine 遥感云计算平台上集成了海量遥感数据、强大的算力和丰富的算子,使得大规模尺度长时间序列的遥感数据分析可以在线快速完成,其中一大利器便是map算子。本期我们来详细介绍map算子的作用,它和传统for循环的区别,以及如何巧用map算子优化代码,提高计算效率。

  一、 map算子的作用

  map算子是我们在云计算平台上处理影像时常用的算子,可以对集合(List、FeatureCollection、ImageCollection)中的每一个元素进行操作,操作完成返回的结果仍是一个集合对象。以FeatureCollection调用map算子为例,其基本形式如下:

  var featureCol = pie.FeatureCollection('NGCC/CHINA_PROVINCE_BOUNDARY');

  var featureColNew = featureCol.map(function (feature) {

  var geometry = feature.geometry();

  var featureNew = pie.Feature(geometry.centroid());

  return featureNew;

  })

  上述代码取出featureCol 中的每一个feature,然后求取各feature的几何中心,得到一个新的矢量集合-featureColNew。

  二、map算子和for循环的区别

  当然,有些map操作用传统的for/while循环也可以实现,但二者在计算机制上有本质区别,for循环是在前端控制变量的循环,且是顺序执行代码,效率比较慢,一般在PIE-Engine里很少用。而map则是在后台服务器上直接作用于集合中的元素进行循环操作,执行效率很快,相当于“并行执行任务”, 但在map里一般不再用 print、Map、Export 以及Reducer等方法。下面分别对比在集合中使用map算子和for循环的不同之处。

  针对List中的每个元素进行循环计算

  //对List中的每个元素加1,采用map算子

  var list1 = pie.List([1,2,3,2]);

  var list2 = list1.map(function (value) {

  return pie.Number(value).add(1);

  });

  print("list2",list2);

  输出结果:

  //对List中的每个元素加1,采用for循环

  var list1 = pie.List([1,2,3,2]);

  var list2 = [];

  for(var i = 0;i

  list2.push(pie.Number(list1.get(i)).add(1).getInfo());

  }

  print("list2",list2);

  输出结果:

  List集合调用map算子后便可直接作用于其中的元素,而采用for循环则还需要增加诸多限制,才能实现相同的功能。

  针对FeatureCollection中的每个Feature进行循环计算

  利用中国省级行政区划矢量数据计算每个省的面积,分别采用map算子和for循环进行计算。

  (1)取FeatureCollection中的每个元素并计算其面积,采用map算子:

  向上滑动阅览

  var featureCol = pie.FeatureCollection().load('NGCC/CHINA_PROVINCE_BOUNDARY');

  var featureColNew = featureCol.map(function (feature) {

  var name = feature.get("name");

  var geometry = feature.geometry();

  var area = geometry.area().divide(1000000);

  feature = feature.set("name",name);

  feature = feature.set("area",area);

  return feature;

  })

  var result = featureColNew.reduceColumns(pie.Reducer.toList(2),["name","area"]);

  print("result",result);

  Map.addLayer(featureCol,,"featureCol");

  Map.setCenter(118,39.7,3);

  代码链接:

  https://engine.piesat.cn/engine-share/shareCode.html?id=cbe5f4f5efca4b5faa8344b0ab325c04

  采用map算子获取中国各省的面积

  (2)取FeatureCollection中的每个元素并计算其面积,采用for循环:

  向上滑动阅览

  var featureCol = pie.FeatureCollection().load('NGCC/CHINA_PROVINCE_BOUNDARY');

  print(featureCol)

  for(i = 0; i

  var name = featureCol.getAt(i).get("name");

  var geometry = featureCol.getAt(i).geometry();

  var area = geometry.area().divide(1000000);

  print(name,area);

  }

  Map.addLayer(featureCol,,"featureCollection");

  Map.setCenter(118,39.7,3);

  代码链接:

  https://engine.piesat.cn/engine-share/shareCode.html?id=4198d136975841269e367aec1ae47e70

  运行结果:

  ▲for循环输出各省面积

  上述代码采用map算子,2秒即可出结果,而for循环则需要40秒,等待时间较长,从而体现map算子的优势。

  针对ImageCollection中的每个Image进行循环计算

  (1)取ImageCollection中的每个元素计算NDVI,采用map算子:

  向上滑动阅览

  var featureCol = pie.FeatureCollection().load('NGCC/CHINA_PROVINCE_BOUNDARY');

  var beijing = featureCol.filter(pie.Filter.eq("name", "北京市"));

  var bjGeo = beijing.getAt(0).geometry();

  var visParams = ;

  Map.addLayer(beijing, visParams, "北京市");

  Map.centerObject(beijing, 6);

  var imageCol = pie.ImageCollection("LC08/01/T1")

  .filterDate("2019-12-01", "2019-12-31")

  .filterBounds(bjGeo);

  print("imageCol", imageCol);

  var imageColNDVI = imageCol.map(function (image) {

  // NDVI计算

  var img_Nir = image.select("B5");

  var img_Red = image.select("B4");

  var img_NDVI = img_Nir.subtract(img_Red).divide(img_Nir.add(img_Red)).rename("NDVI");

  return image.addBands(img_NDVI);

  });

  print("imageColNDVI", imageColNDVI);

  //NDVI绘制样式

  var visParamNDVI = {

  min: -0.2,

  max: 0.8,

  palette: 'CA7A41, CE7E45, DF923D, F1B555, FCD163, 99B718, '+

  '74A901, 66A000, 529400,3E8601, 207401, 056201, 004C00,'+

  '023B01, 012E01, 011D01, 011301'

  };

  var imageNDVI = imageColNDVI.select("NDVI").mosaic().clip(bjGeo);

  Map.addLayer(imageNDVI, visParamNDVI, "Layer_NDVI");

  代码链接:

  https://engine.piesat.cn/engine-share/shareCode.html?id=4ec895ce6e3b411daab877713ca81f45

  输出结果:

  (2)取ImageCollection中的每个元素计算NDVI,采用for循环:

  向上滑动阅览

  var featureCol = pie.FeatureCollection().load('NGCC/CHINA_PROVINCE_BOUNDARY');

  var beijing = featureCol.filter(pie.Filter.eq("name", "北京市"));

  var bjGeo = beijing.getAt(0).geometry();

  var visParams = { color: "ff0000ff", fillColor: "00000000" };

  Map.addLayer(beijing, visParams, "北京市");

  Map.centerObject(beijing, 6);

  var imageCol = pie.ImageCollection("LC08/01/T1")

  .filterDate("2019-8-01", "2019-8-30")

  .filterBounds(bjGeo);

  print("imageCol", imageCol);

  var newCol=[];

  for (i = 0; i

  var image = imageCol.getAt(i);

  var img_Nir = image.select("B5");

  var img_Red = image.select("B4");

  var img_NDVI = img_Nir.subtract(img_Red).divide(img_Nir.add(img_Red))

  .rename("NDVI");

  image = image.addBands(img_NDVI);

  newCol.push(image);

  }

  var newImageCol=pie.ImageCollection().fromImages(newCol);

  print("newImageCol", newImageCol);

  //NDVI绘制样式

  var visParamNDVI = {

  min: -0.2,

  max: 0.8,

  palette: 'CA7A41, CE7E45, DF923D, F1B555, FCD163, 99B718, ' +

  '74A901, 66A000, 529400,3E8601, 207401, 056201, 004C00,' +

  '023B01, 012E01, 011D01, 011301'

  };

  var imageNDVI = newImageCol.select("NDVI").mosaic().clip(bjGeo);

  Map.addLayer(imageNDVI, visParamNDVI, "Layer_NDVI");

  代码链接:

  https://engine.piesat.cn/engine-share/shareCode.html?id=ef81bdf97c8d45809c3101f5f8dee4c4

  上述代码采用map算子和for循环的计算时间基本相同, 但在使用for循环时要重新构造一个存放新的image集合的数组,并在循环结束后重新构造一个由这些image组成的ImageCollection,在步骤上较为复杂。

  因此,在遥感云计算平台中,涉及到对集合中的每个元素进行操作时,推荐使用map算子,快速且便利。但前述提到,在map算子中不宜再用 print、Map、Export 以及Reducer等方法,如果需要对集合中的每个元素进行统计操作,则可用for循环代替,以下代码展示了使用for循环统计北京各城区提取的建筑区面积:

  向上滑动阅览

  var chn = pie.FeatureCollection('NGCC/CHINA_PROVINCE_BOUNDARY');

  var beijing = chn.filter(pie.Filter.eq("name", "北京市"));

  var bjGeo = beijing.getAt(0).geometry();

  var chn2 = pie.FeatureCollection('NGCC/CHINA_COUNTY_BOUNDARY');

  var beijing2 = chn2.filter(pie.Filter.eq("cname", "北京市"));

  var bjGeo2 = beijing2.getAt(0).geometry();

  Map.centerObject(beijing, 7)

  var visParams = { color: "ff0000ff", fillColor: "00000000" };

  Map.addLayer(beijing, visParams, "北京市边界");

  Map.addLayer(beijing2, visParams, "北京市各区");

  function rmCloud(image) {

  var qa = image.select("BQA");

  var cloudMask = qa.bitwiseAnd(1

  return image.updateMask(cloudMask);

  }

  var l8 = pie.ImageCollection("LC08/01/T1")

  .filterDate("2020-7-1", "2020-8-30")

  .filterBounds(bjGeo)

  .select(["B2", "B3", "B4", "B5", "B6", "BQA"])

  .map(rmCloud);

  //计算用到的指数

  function imgCalculate(image) {

  var green = image.select("B3");

  var red = image.select("B4");

  var nir = image.select("B5");

  var swir1 = image.select("B6");

  var ndvi = (nir.subtract(red)).divide(nir.add(red)).rename("NDVI");

  var mndwi = green.subtract(swir1)

  .divide(green.add(swir1))

  .rename("MNDWI");

  return image.addBands(ndvi).addBands(mndwi);

  }

  var imgCol = l8.map(imgCalculate)

  .mean()

  .clip(bjGeo);

  Map.addLayer(imgCol, { min: 0, max: 3000, bands: ["B4", "B3", "B2"] }, "imgCol");

  var ndvi = imgCol.select("NDVI");

  var nonVeg = imgCol.updateMask(ndvi.lte(0.6));

  Map.addLayer(nonVeg, { min: 0, max: 3000, bands: ["B4", "B3", "B2"] }, "nonVeg");

  var mndwi = imgCol.select("MNDWI");

  var nonVegWater = nonVeg.updateMask(mndwi.lte(0.3));

  Map.addLayer(nonVegWater, { min: 0, max: 3000, bands: ["B4", "B3", "B2"] }, "nonVegWater");

  var nonVegWater2 = nonVegWater.select("B2").gt(0);

  Map.addLayer(nonVegWater2, { min: 0, max: 1, palette: "ff0000" }, "nonVegWater2");

  var areaImage = nonVegWater2.pixelArea().multiply(nonVegWater2.gt(0));

  var area = areaImage.reduceRegion(pie.Reducer.sum(), bjGeo, 30);

  print("北京市建筑用地面积(单位:平方千米): ", pie.Number(area.get("constant")).divide(1000000));

  var newFeatures = [];

  for (var i = 0; i

  var temp = nonVegWater2.clip(beijing2.getAt(i).geometry());

  var areaImg = temp.pixelArea().multiply(temp.gt(0));

  var area = areaImg.reduceRegion(pie.Reducer.sum(), beijing2.getAt(i).geometry(), 30);

  newFeatures.push(beijing2.getAt(i).set("area", area.get("constant")));

  }

  beijing2 = pie.FeatureCollection(newFeatures);

  print("beijing2",beijing2);

  var result = beijing2.reduceColumns(pie.Reducer.toList(2), ["name", "area"]);

  print("result", result);

  代码链接:

  https://engine.piesat.cn/engine-share/shareCode.html?id=bf885222bf584f33aaa96c2a0093c03d

  输出结果:

  三、巧用map算子,提高计算效率

  map算子带来便利的同时,也将大量的计算转移给了后台计算服务。通常我们在影像处理时会计算多个指数,单个指数的计算公式通常会写成函数的形式方便调用。多个map算子共同使用时,相当于多次循环,所涉及到的运算量也很大,怎样使用map算子才能优化计算逻辑,提高计算效率呢?

  下面以去云后计算裸土指数BSI、改进的归一化差异水体指数MNDWI、增强型的裸土指数EBSI、建筑用地指数NDBI等4个指数的计算为例,来说明如何在代码级别进行优化来减少计算量从而提高计算效率。

  方法1,将每个指数的计算单独写成函数,在筛选完影像后依次用map算子调用:

  向上滑动阅览

  var chn = pie.FeatureCollection('NGCC/CHINA_PROVINCE_BOUNDARY');

  var beijing = chn.filter(pie.Filter.eq("name", "北京市"));

  var bjGeo = beijing.getAt(0).geometry();

  Map.centerObject(beijing, 7)

  var visParams = { color: "ff0000ff", fillColor: "00000000" };

  Map.addLayer(beijing, visParams, "北京市边界");

  //去云

  function rmCloud(image) {

  var qa = image.select("BQA");

  var cloudMask = qa.bitwiseAnd(1

  return image.updateMask(cloudMask);

  }

  //裸土指数BSI: [(B06 + B04)-(B05 + B02)]/[(B06 + B04)+(B05 + B02)]

  function BSI(image) {

  var nir = image.select("B5");

  var swir1 = image.select("B6");

  var red = image.select("B4");

  var blue = image.select("B2");

  var bsi = (swir1.add(red).subtract(nir.add(blue)))

  .divide(swir1.add(red).add(nir.add(blue)));

  return image.addBands(bsi.rename("BSI"));

  }

  //改进的归一化差异水体指数MNDWI: (B03 - B06)/(B03 + B06)

  function MNDWI(image) {

  var mndwi = image.select("B3").subtract(image.select("B6"))

  .divide(image.select("B3").add(image.select("B6")))

  return image.addBands(mndwi.rename("MNDWI"));

  }

  //增强型的裸土指数EBSI:(BSI - MNDWI)/(BSI + MNDWI)

  function EBSI(image) {

  var mndwi = image.select("MNDWI");

  var bsi = image.select("BSI");

  var ebsi = (bsi.subtract(mndwi)).divide(bsi.add(mndwi));

  return image.addBands(ebsi.rename("EBSI"));

  }

  //建筑用地指数NDBI: (B06 - B05)/(B06 + B05)

  function NDBI(image) {

  var ndbi = image.select("B6").subtract(image.select("B5"))

  .divide(image.select("B6").add(image.select("B5")))

  return image.addBands(ndbi.rename("NDBI"));

  }

  //加载Landsat 8影像数据集合

  var imgColl8 = pie.ImageCollection("LC08/01/T1")

  .filterDate("2020-4-1", "2020-4-30")

  .filterBounds(bjGeo)

  .select(["B2", "B3", "B4", "B5", "B6", "B7", "BQA"])

  .map(rmCloud)

  .map(BSI)

  .map(MNDWI)

  .map(EBSI)

  .map(NDBI)

  .mean()

  .clip(bjGeo);

  print("imgColl8",imgColl8);

  Map.addLayer(imgColl8, { min: 0, max: 3000, bands: ["B4", "B3", "B2"] }, "imgCol1");

  Map.addLayer(imgColl8.select("BSI"), { min: -0.2, max: 0.2 }, "BSI");

  Map.addLayer(imgColl8.select("NDBI"), { min: -0.2, max: 0.2 }, "NDBI");

  Map.addLayer(imgColl8.select("MNDWI"), , "MNDWI");

  Map.addLayer(imgColl8.select("EBSI"), { min: 0, max: 1 }, "EBSI");

  代码链接:

  https://engine.piesat.cn/engine-share/shareCode.html?id=402cadc45985400c8650620b9d93bad9

  上述代码共调用了5次map算子,相当于对筛选后的影像进行了5次遍历,除去云操作外,每一次都是对每景影像进行波段运算完后添加计算后的指数,将大量的算力消耗在了重复读取和写入上,输出计算结果用时85秒,完整显示用时135秒。

  依次调用多个map计算每个指数

  方法2,将去云及指数运算封装成一个函数,在筛选完影像后仅用map算子调用一次:

  向上滑动阅览

  var chn = pie.FeatureCollection('NGCC/CHINA_PROVINCE_BOUNDARY');

  var beijing = chn.filter(pie.Filter.eq("name", "北京市"));

  var bjGeo = beijing.getAt(0).geometry();

  Map.centerObject(beijing, 7)

  var visParams = { color: "ff0000ff", fillColor: "00000000" };

  Map.addLayer(beijing, visParams, "北京市边界");

  var imgColl8 = pie.ImageCollection("LC08/01/T1")

  .filterDate("2020-4-1", "2020-4-30")

  .filterBounds(bjGeo)

  .select(["B2", "B3", "B4", "B5", "B6", "B7", "BQA"]);

  //影像处理函数

  function imgCalculate(image) {

  var qa = image.select("BQA");

  var cloudMask = qa.bitwiseAnd(1

  image = image.updateMask(cloudMask);

  var blue = image.select("B2");

  var green = image.select("B3");

  var red = image.select("B4");

  var nir = image.select("B5");

  var swir1 = image.select("B6");

  var bsi = (swir1.add(red).subtract(nir.add(blue)))

  .divide(swir1.add(red).add(nir.add(blue)))

  .rename("BSI");

  var mndwi = green.subtract(swir1)

  .divide(green.add(swir1))

  .rename("MNDWI");

  var ebsi = (bsi.subtract(mndwi)).divide(bsi.add(mndwi))

  .rename("EBSI");

  var ndbi = swir1.subtract(nir)

  .divide(swir1.add(nir))

  .rename("NDBI");

  return image.addBands(mndwi).addBands(bsi).addBands(ebsi)

  .addBands(ndbi);

  }

  imgColl8 = imgColl8.map(imgCalculate).mean().clip(bjGeo);

  print("imgColl8", imgColl8);

  Map.addLayer(imgColl8, { min: 0, max: 3000, bands: ["B4", "B3", "B2"] }, "imgCol1");

  Map.addLayer(imgColl8.select("BSI"), { min: -0.2, max: 0.2 }, "BSI");

  Map.addLayer(imgColl8.select("NDBI"), { min: -0.2, max: 0.2 }, "NDBI");

  Map.addLayer(imgColl8.select("MNDWI"), , "MNDWI");

  Map.addLayer(imgColl8.select("EBSI"), { min: 0, max: 1 }, "EBSI");

  代码链接:

  https://engine.piesat.cn/engine-share/shareCode.html?id=ce08fdb1cca147acb6ae6da7629fb49f

  将指数计算封装到一个函数中调用

  上述代码仅调用了1次map算子,对筛选后的影像进行了去云操作以及4个指数波段的添加,仅需对每景影像读取写入一次,大大节省了算力,只用8秒即可输出结果并完整显示,相比于方法1,计算速度提升近10倍。

  学会了这种思路后,平常我们在编写代码时,注意将计算过程优化,就可以提高计算效率,减少等待时间。

  榜单收录、高管收录、融资收录、活动收录可发送邮件至645528#qq.com(把#换成@)。

相关阅读

    无相关信息